INDEX
Negative Logits
ஸ
-0.08
丝毫不
-0.07
🙋
-0.07
筜
-0.07
.bill
-0.06
contemplating
-0.06
做饭
-0.06
dB
-0.06
ド
-0.06
美味し
-0.06
POSITIVE LOGITS
завод
0.08
的说法
0.07
avery
0.07
ational
0.07
下跌
0.07
──
0.07
הישרא
0.07
內容
0.07
fait
0.06
ורים
0.06
Activations Density 0.003%