INDEX
Negative Logits
"os
-0.10
asin
-0.08
लाग
-0.08
diaria
-0.08
fb
-0.08
tossing
-0.08
usid
-0.08
umwe
-0.08
mathemat
-0.07
)="
-0.07
POSITIVE LOGITS
minorities
0.10
Majority
0.09
minority
0.09
Minority
0.08
majorité
0.08
gamers
0.08
nés
0.08
fears
0.08
族自治
0.07
predomin
0.07
Activations Density 0.018%