INDEX
Negative Logits
dial
-0.09
vragen
-0.08
കര്
-0.08
ethnic
-0.08
ندگان
-0.08
bun
-0.08
男女
-0.08
സ്വദേശ
-0.08
ンド
-0.07
यों
-0.07
POSITIVE LOGITS
T
0.09
T
0.08
Affinity
0.08
RL
0.08
και
0.07
riques
0.07
τρί
0.07
Percent
0.07
Emin
0.07
Af
0.07
Activations Density 0.000%