INDEX
Negative Logits
纷
-0.09
nisam
-0.09
belum
-0.09
国务院
-0.08
之前
-0.08
ذار
-0.08
此前
-0.08
ೆಗಳ
-0.08
όχι
-0.08
惨
-0.08
POSITIVE LOGITS
excels
0.09
зато
0.08
hingegen
0.08
fontsize
0.08
encuent
0.08
suited
0.07
Long
0.07
cleaner
0.07
advantages
0.07
Long
0.07
Activations Density 0.070%