INDEX
Negative Logits
物品
-0.07
WOM
-0.06
驮
-0.06
根本就不
-0.06
钜
-0.06
ugh
-0.06
cult
-0.06
_COMPILE
-0.06
mins
-0.06
motor
-0.06
POSITIVE LOGITS
▲
0.08
?</
0.08
龙泉
0.08
sparks
0.08
...");↵↵
0.07
Consort
0.07
?;↵
0.07
.";↵↵
0.07
concerns
0.07
😼
0.07
Activations Density 0.002%