INDEX
Negative Logits
ennial
-0.08
еч
-0.08
advised
-0.08
interracial
-0.08
LGBTQ
-0.08
ಮ
-0.07
fel
-0.07
ficiency
-0.07
ದಲ
-0.07
fechamento
-0.07
POSITIVE LOGITS
OF
0.09
-games
0.08
বুঝ
0.08
perturb
0.08
rip
0.07
quadr
0.07
σα
0.07
Different
0.07
megs
0.07
0.07
Activations Density 0.000%