INDEX
Negative Logits
date
-0.08
兕
-0.07
ߜ
-0.07
Dove
-0.07
ו
-0.07
.readline
-0.07
sich
-0.07
-Cds
-0.06
fa
-0.06
ft
-0.06
POSITIVE LOGITS
unreasonable
0.08
entric
0.07
Monetary
0.07
раб
0.07
냉
0.07
mixed
0.07
밧
0.07
Ren
0.06
testimonial
0.06
쨉
0.06
Activations Density 0.001%