INDEX
Negative Logits
idagi
-0.08
ists
-0.08
_gl
-0.08
_destroy
-0.07
romax
-0.07
gl
-0.07
atham
-0.07
aton
-0.07
следующие
-0.07
-area
-0.07
POSITIVE LOGITS
。同
0.09
電
0.08
vrijwill
0.08
同
0.08
عضو
0.08
oneself
0.08
болып
0.08
鉄
0.08
friv
0.08
sekal
0.07
Activations Density 0.041%