INDEX
Negative Logits
civil
-0.07
Lind
-0.07
�
-0.07
Ji
-0.07
vesel
-0.07
വും
-0.07
baixos
-0.07
none
-0.07
Families
-0.07
താണ്
-0.07
POSITIVE LOGITS
мной
0.09
wr
0.08
布
0.08
===
0.08
rch
0.07
عبر
0.07
_/
0.07
Mur
0.07
aloud
0.07
-либо
0.07
Activations Density 0.005%