INDEX
Negative Logits
Goat
-0.07
polished
-0.07
氘
-0.07
chief
-0.06
<Image
-0.06
Miy
-0.06
libertine
-0.06
.Movie
-0.06
Discipline
-0.06
renal
-0.06
POSITIVE LOGITS
AUTH
0.07
overweight
0.07
ederal
0.07
课
0.07
_reply
0.07
开来
0.06
上传
0.06
⾏
0.06
erequisite
0.06
思い出
0.06
Activations Density 0.001%