INDEX
Negative Logits
strapped
-0.08
intval
-0.08
léger
-0.07
公务
-0.07
skept
-0.07
처
-0.07
hurt
-0.07
nonprofits
-0.07
адна
-0.07
atts
-0.07
POSITIVE LOGITS
剤
0.08
ян
0.08
<Data
0.07
straight
0.07
яма
0.07
_gradient
0.07
DAS
0.07
Fug
0.07
Alice
0.07
fug
0.07
Activations Density 0.001%