INDEX
Negative Logits
ribbon
-0.08
inned
-0.08
Coupon
-0.07
curry
-0.07
Climate
-0.07
蓄
-0.07
المرأ
-0.06
persisted
-0.06
/ts
-0.06
opinion
-0.06
POSITIVE LOGITS
说出
0.08
.Ct
0.08
~↵↵
0.07
десят
0.07
бед
0.07
noktası
0.07
—↵↵
0.07
enerated
0.07
--+
0.07
书记
0.07
Activations Density 0.010%