INDEX
Negative Logits
盗
-0.08
cial
-0.08
Guerr
-0.07
ోగ
-0.07
licos
-0.07
ylim
-0.07
Gang
-0.07
�
-0.07
-L
-0.07
ర్ల
-0.07
POSITIVE LOGITS
lat
0.08
прих
0.08
unh
0.08
presumed
0.07
submiss
0.07
jurisdictions
0.07
kegiatan
0.07
pá
0.07
lat
0.07
eco
0.07
Activations Density 0.008%