INDEX
Negative Logits
nor
-0.09
sing
-0.08
goto
-0.08
nor
-0.08
singular
-0.07
inspiring
-0.07
admin
-0.07
hop
-0.07
χει
-0.07
nam
-0.07
POSITIVE LOGITS
aján
0.09
stelle
0.09
इन्ह
0.09
julọ
0.09
farà
0.09
ustu
0.09
achten
0.09
recommand
0.08
等级
0.08
terme
0.08
Activations Density 0.002%