INDEX
Negative Logits
umin
-0.07
Crit
-0.06
ffe
-0.06
성을
-0.06
andan
-0.06
acidad
-0.06
ّر
-0.06
(IDC
-0.06
capacit
-0.06
erner
-0.06
POSITIVE LOGITS
iloc
0.07
praise
0.06
battleground
0.06
pictured
0.06
عنوان
0.06
=====
0.06
púb
0.06
فق
0.06
letion
0.06
Luc
0.06
Activations Density 0.000%