INDEX
Negative Logits
علوم
-0.07
ุย
-0.06
mulheres
-0.06
�
-0.06
falsely
-0.06
âte
-0.06
tournament
-0.06
xb
-0.06
ули
-0.06
quiv
-0.06
POSITIVE LOGITS
login
0.06
melon
0.06
icious
0.06
dehydration
0.06
(#
0.06
actu
0.06
Font
0.06
millennia
0.06
strate
0.06
RODUCTION
0.06
Activations Density 0.000%