INDEX
Negative Logits
bow
-0.09
ඳ
-0.09
yddol
-0.08
führt
-0.08
等等
-0.08
заряд
-0.08
degrees
-0.08
�
-0.08
등에
-0.08
염
-0.08
POSITIVE LOGITS
accented
0.09
adéqu
0.08
Sa
0.07
नीय
0.07
appropri
0.07
bagay
0.07
nebude
0.07
irrelevant
0.07
,std
0.07
norm
0.07
Activations Density 0.001%