INDEX
Negative Logits
_sn
-0.07
conven
-0.06
thưởng
-0.06
ospital
-0.06
_human
-0.06
metic
-0.06
.Con
-0.06
NEL
-0.06
suchen
-0.06
-qu
-0.06
POSITIVE LOGITS
transgender
0.08
fractured
0.07
שונה
0.07
TestCategory
0.07
classmates
0.07
apsible
0.07
kararı
0.06
książki
0.06
expire
0.06
"description
0.06
Activations Density 0.012%