INDEX
Negative Logits
שבו
-0.08
居
-0.07
ﮫ
-0.07
书法
-0.07
峦
-0.07
ographical
-0.06
evalu
-0.06
valu
-0.06
punishing
-0.06
reads
-0.06
POSITIVE LOGITS
אור
0.07
Ordered
0.07
cruelty
0.07
cord
0.07
($.
0.07
($.
0.07
Shortly
0.07
Modification
0.06
fins
0.06
티
0.06
Activations Density 0.003%