INDEX
Negative Logits
_indicator
-0.08
гы
-0.08
_roll
-0.08
/blog
-0.08
(or
-0.07
것을
-0.07
fs
-0.07
auteurs
-0.07
japan
-0.07
arms
-0.07
POSITIVE LOGITS
čina
0.08
imų
0.07
buru
0.07
員
0.07
Пот
0.07
Katr
0.07
ियत
0.07
portals
0.07
spotless
0.07
ন্ত
0.07
Activations Density 0.003%