INDEX
Negative Logits
unsus
-0.07
illustr
-0.07
اطلاع
-0.06
zeichnet
-0.06
Nintendo
-0.06
_unused
-0.06
Klaus
-0.06
свою
-0.06
(Il
-0.06
кан
-0.06
POSITIVE LOGITS
aerobic
0.13
obic
0.08
ahora
0.07
east
0.07
awk
0.07
exercises
0.06
stringBy
0.06
rub
0.06
certify
0.06
rych
0.06
Activations Density 0.001%