INDEX
Negative Logits
vượt
-0.06
ีก
-0.06
evaluation
-0.06
_passed
-0.06
LLC
-0.06
ape
-0.06
nationalism
-0.06
222
-0.05
(ax
-0.05
,说
-0.05
POSITIVE LOGITS
___
0.07
URA
0.06
όρ
0.06
URY
0.06
Å
0.06
sparks
0.06
�
0.06
otřeb
0.06
ــــ
0.06
:aload
0.06
Activations Density 0.007%