INDEX
Negative Logits
발
-0.08
dish
-0.07
salads
-0.07
리아
-0.07
iano
-0.07
.source
-0.07
atriz
-0.07
व्य
-0.07
Nar
-0.07
поздрав
-0.07
POSITIVE LOGITS
洁
0.11
liness
0.11
晰
0.08
sạch
0.08
楚
0.08
conscience
0.08
潔
0.08
(clean
0.08
净
0.08
Slate
0.08
Activations Density 0.028%