INDEX
Negative Logits
SB
-0.08
erken
-0.08
にも
-0.08
에도
-0.08
hamb
-0.08
celebr
-0.08
sele
-0.08
колес
-0.08
വീ
-0.08
Transportation
-0.08
POSITIVE LOGITS
_.
0.08
(CON
0.08
ыг
0.08
.gu
0.08
“El
0.07
旗
0.07
“He
0.07
`${0.07
ίκ
0.07
ётся
0.07
Activations Density 0.000%