INDEX
Negative Logits
ijs
-0.08
co
-0.08
النس
-0.08
Checkbox
-0.08
romance
-0.07
خان
-0.07
المال
-0.07
intimacy
-0.07
rocky
-0.07
hype
-0.07
POSITIVE LOGITS
loudly
0.11
चम
0.10
louder
0.09
તે�
0.09
Visibility
0.08
наруж
0.08
Visibility
0.08
unmistak
0.08
चिन
0.08
đer
0.08
Activations Density 0.011%