INDEX
Negative Logits
dil
-0.08
ﯽ
-0.07
fadeIn
-0.07
빽
-0.07
�
-0.07
ญา
-0.07
盘活
-0.06
gmt
-0.06
Expect
-0.06
袂
-0.06
POSITIVE LOGITS
украин
0.08
utter
0.07
(make
0.07
otras
0.07
올
0.07
dõi
0.07
otros
0.07
roof
0.07
over
0.07
ISTORY
0.07
Activations Density 0.005%