INDEX
Negative Logits
Harmony
-0.08
ಉದ್ಯ
-0.07
)은
-0.07
paper
-0.07
visibility
-0.07
)/
-0.07
unteer
-0.07
))/
-0.07
font
-0.07
готов
-0.07
POSITIVE LOGITS
结果
0.10
即可
0.10
you'll
0.09
結果
0.09
тит
0.08
覆盖
0.08
chrom
0.08
તમ
0.08
jd
0.08
you'd
0.08
Activations Density 0.008%