INDEX
Negative Logits
hap
-0.09
dienst
-0.08
سلام
-0.08
ಸಾಗ
-0.08
illuminate
-0.07
PCS
-0.07
ballast
-0.07
smell
-0.07
حفظ
-0.07
.helpers
-0.07
POSITIVE LOGITS
માં
0.08
cours
0.08
outright
0.08
autistic
0.07
Sidney
0.07
geral
0.07
อยู่
0.07
overw
0.07
ആയ
0.07
ते
0.07
Activations Density 0.011%