INDEX
Negative Logits
เอฟ
-0.08
Wasch
-0.08
�
-0.07
Sticker
-0.07
Grinding
-0.07
γμα
-0.07
خون
-0.07
Quil
-0.07
口
-0.07
repl
-0.07
POSITIVE LOGITS
unin
0.11
社会主义
0.08
луг
0.08
golf
0.08
bund
0.08
unj
0.08
l
0.07
мін
0.07
neutr
0.07
lanan
0.07
Activations Density 0.000%