INDEX
Negative Logits
expelled
-0.08
Quebec
-0.08
所谓
-0.08
Ostr
-0.08
informal
-0.07
scap
-0.07
dishonest
-0.07
washable
-0.07
Last
-0.07
suspects
-0.07
POSITIVE LOGITS
щоб
0.08
_inv
0.08
паг
0.08
වෙ
0.08
cit
0.08
configure
0.07
आम्ह
0.07
vorbe
0.07
COUR
0.07
פאַר
0.07
Activations Density 0.000%