INDEX
Negative Logits
elon
-0.07
AVOR
-0.07
profess
-0.06
ipsis
-0.06
choć
-0.06
<|im_start|>
-0.06
lbl
-0.06
Cool
-0.06
Wh
-0.06
的性格
-0.06
POSITIVE LOGITS
Moment
0.08
Ҽ
0.08
corre
0.07
_REC
0.07
esti
0.07
푀
0.07
ventilation
0.07
halfway
0.07
סו
0.07
nex
0.07
Activations Density 0.014%