INDEX
Negative Logits
cedes
-0.08
郁闷
-0.07
🆗
-0.06
�
-0.06
inev
-0.06
%%%
-0.06
_xy
-0.06
谢韵
-0.06
מאבק
-0.06
ومع
-0.06
POSITIVE LOGITS
(sp
0.07
Replacing
0.07
bụ
0.07
_recipe
0.07
-post
0.07
hại
0.06
ClassName
0.06
(se
0.06
.validator
0.06
writing
0.06
Activations Density 0.005%