INDEX
Negative Logits
samp
-0.08
Lus
-0.07
104
-0.07
Fut
-0.07
FEATURE
-0.07
Sho
-0.07
Filesystem
-0.07
lj
-0.07
253
-0.07
úpl
-0.06
POSITIVE LOGITS
以来
0.08
�
0.08
Doll
0.08
dugu
0.08
DG
0.07
猫
0.07
infant
0.07
tutt
0.07
奉
0.07
écr
0.07
Activations Density 0.003%