INDEX
Negative Logits
졌다
-0.07
सच
-0.07
تو
-0.06
Sarah
-0.06
_VIEW
-0.06
stealth
-0.06
утвержд
-0.06
chts
-0.06
Thủ
-0.06
лини
-0.06
POSITIVE LOGITS
اظ
0.07
’
0.06
COMP
0.06
.Cont
0.06
wage
0.06
-if
0.06
Figure
0.06
RES
0.06
ENTE
0.06
-not
0.06
Activations Density 0.051%