INDEX
Negative Logits
uncon
-0.10
believe
-0.08
acredit
-0.08
sobres
-0.08
sólido
-0.08
solid
-0.08
Avail
-0.08
-0.07
governments
-0.07
よろしく
-0.07
POSITIVE LOGITS
дру
0.08
elő
0.08
mittels
0.08
тур
0.07
판
0.07
_DST
0.07
Roch
0.07
ান্ত
0.07
jest
0.07
дороге
0.07
Activations Density 0.011%