INDEX
Negative Logits
öhn
-0.08
adó
-0.08
리고
-0.08
hout
-0.08
uant
-0.08
ogne
-0.08
adzi
-0.08
adz
-0.08
ondon
-0.08
hait
-0.08
POSITIVE LOGITS
ಸ್ಥ
0.08
طرح
0.08
سب
0.08
سا
0.07
Cara
0.07
ೇಕ
0.07
Naughty
0.07
_NATIVE
0.07
شا
0.07
EF
0.07
Activations Density 0.000%