INDEX
Negative Logits
kelig
-0.08
faire
-0.08
persons
-0.07
sabe
-0.07
ORD
-0.07
ارش
-0.07
_THE
-0.06
preferences
-0.06
araştırma
-0.06
validate
-0.06
POSITIVE LOGITS
अपर
0.06
Se
0.06
[].
0.06
housed
0.06
Posted
0.06
tracker
0.06
unter
0.06
出去
0.06
roz
0.06
PS
0.06
Activations Density 0.002%