INDEX
Negative Logits
irr
-0.07
备
-0.07
进入
-0.07
urka
-0.07
RT
-0.07
-0.07
gdy
-0.07
কদের
-0.07
azi
-0.07
Vacancy
-0.07
POSITIVE LOGITS
uncon
0.08
enjeux
0.08
FOX
0.08
sprach
0.08
חשוב
0.07
ενεργ
0.07
_FIELD
0.07
Ukrainian
0.07
VEH
0.07
voluptate
0.07
Activations Density 0.003%