INDEX
Negative Logits
cn
-0.09
grau
-0.08
Mont
-0.08
umf
-0.07
revoke
-0.07
US
-0.07
Angeb
-0.07
honum
-0.07
sore
-0.07
moor
-0.07
POSITIVE LOGITS
pedagog
0.08
допуска
0.08
ajj
0.07
0.07
більш
0.07
педагог
0.07
Authorized
0.07
தெர
0.07
Authorized
0.07
adii
0.07
Activations Density 0.007%