INDEX
Negative Logits
agas
-0.08
ag
-0.08
suspicion
-0.08
双方
-0.07
tør
-0.07
调查
-0.07
新品
-0.07
expert
-0.07
hov
-0.07
nghị
-0.07
POSITIVE LOGITS
Stmt
0.09
midnight
0.08
Lexer
0.08
STYLE
0.08
Dinner
0.08
_stmt
0.08
ueuse
0.08
(style
0.08
Midnight
0.08
등에
0.08
Activations Density 0.000%