INDEX
Negative Logits
:X
-0.08
annoyed
-0.08
�
-0.08
ingi
-0.08
XP
-0.07
203
-0.07
spun
-0.07
lust
-0.07
rek
-0.07
":
-0.07
POSITIVE LOGITS
cellulose
0.09
EW
0.08
व्य
0.08
we've
0.08
precaution
0.08
оцен
0.08
ηλεκ
0.08
abide
0.08
schützen
0.07
algodón
0.07
Activations Density 0.036%