INDEX
Negative Logits
itg
-0.08
-0.08
ệt
-0.08
Locale
-0.07
molestie
-0.07
poul
-0.07
Dos
-0.07
brou
-0.07
эксплуата
-0.07
icherung
-0.07
POSITIVE LOGITS
/C
0.08
afet
0.08
Census
0.07
排
0.07
Заб
0.07
Jud
0.07
ex
0.07
Vision
0.07
selected
0.07
lau
0.07
Activations Density 0.002%