INDEX
Negative Logits
ై
-0.08
withstand
-0.07
машины
-0.07
rõ
-0.07
맛
-0.07
Spike
-0.07
არგ
-0.07
وه
-0.07
Reve
-0.07
ång
-0.07
POSITIVE LOGITS
-sama
0.09
�
0.08
bro
0.08
�
0.08
pun
0.07
�
0.07
///
0.07
pid
0.07
努力
0.07
Ca
0.07
Activations Density 0.006%