INDEX
Negative Logits
homeowners
-0.08
pills
-0.08
conc
-0.08
sons
-0.08
pesky
-0.08
�
-0.08
ladr
-0.07
churrasqueira
-0.07
رع
-0.07
toilets
-0.07
POSITIVE LOGITS
Louise
0.09
.say
0.08
🏼
0.08
sick
0.08
Kot
0.08
🏻
0.07
령
0.07
hướng
0.07
subs
0.07
Kot
0.07
Activations Density 0.006%