INDEX
Negative Logits
jewel
-0.09
ellem
-0.08
šanas
-0.08
ással
-0.08
Forum
-0.08
nett
-0.07
profils
-0.07
TODAY
-0.07
Contenido
-0.07
uzzle
-0.07
POSITIVE LOGITS
исправ
0.09
mistakes
0.08
hata
0.08
أسباب
0.08
reasons
0.08
corrections
0.08
ww
0.07
Reasons
0.07
причины
0.07
ೆಗಳ
0.07
Activations Density 0.005%