INDEX
Negative Logits
oasis
-0.09
Itali
-0.08
dislikes
-0.08
Abbey
-0.08
本金
-0.08
originality
-0.08
novices
-0.07
villa
-0.07
денег
-0.07
�
-0.07
POSITIVE LOGITS
cao
0.08
intér
0.08
geladen
0.08
_license
0.08
anunciou
0.07
검
0.07
licença
0.07
gal
0.07
程序
0.07
(Boolean
0.07
Activations Density 0.005%