INDEX
Negative Logits
tido
-0.08
截
-0.07
people
-0.07
不同
-0.07
spoken
-0.07
like
-0.07
zoals
-0.07
uckles
-0.07
ответы
-0.07
firsthand
-0.07
POSITIVE LOGITS
まり
0.08
Mai
0.08
eyeliner
0.08
attire
0.07
Hp
0.07
makam
0.07
Atk
0.07
Mj
0.07
Mas
0.07
イヤ
0.07
Activations Density 0.000%