INDEX
Negative Logits
roofs
-0.08
ment
-0.07
pren
-0.07
жары
-0.07
_USE
-0.07
diploma
-0.07
Jan
-0.07
transf
-0.07
Sir
-0.07
dirigida
-0.07
POSITIVE LOGITS
Jed
0.07
Elton
0.07
Extr
0.07
ikov
0.07
laufen
0.07
soap
0.07
Ir
0.07
ted
0.07
nut
0.07
zircon
0.07
Activations Density 0.005%