INDEX
Negative Logits
váll
-0.08
-0.08
ייַ
-0.08
الاعت
-0.08
Comunic
-0.07
'S
-0.07
সমাজ
-0.07
Paige
-0.07
támogat
-0.07
Related
-0.07
POSITIVE LOGITS
stagger
0.08
bilen
0.08
freely
0.08
ायण
0.07
appellant
0.07
、不
0.07
_dirty
0.07
straight
0.07
mes
0.07
krok
0.07
Activations Density 0.000%