INDEX
Negative Logits
缇
-0.09
borg
-0.07
brethren
-0.07
-box
-0.07
exited
-0.07
profess
-0.07
敝
-0.07
isa
-0.07
者の
-0.07
منه
-0.07
POSITIVE LOGITS
rew
0.07
curly
0.07
玒
0.07
*w
0.07
�
0.06
这些
0.06
ɰ
0.06
/W
0.06
QU
0.06
df
0.06
Activations Density 0.099%