INDEX
Negative Logits
sz
-0.09
sar
-0.08
itats
-0.08
终于
-0.08
coax
-0.08
乃
-0.07
auteurs
-0.07
.LOC
-0.07
Habe
-0.07
-su
-0.07
POSITIVE LOGITS
�
0.08
أخ
0.08
ambitious
0.08
пот
0.08
skeptical
0.07
pot
0.07
formidable
0.07
आ
0.07
smaller
0.07
burden
0.07
Activations Density 0.026%