INDEX
Negative Logits
ата
-0.08
имен
-0.08
-साथ
-0.08
looks
-0.08
zinho
-0.08
нал
-0.07
roads
-0.07
God
-0.07
сок
-0.07
নিউ
-0.07
POSITIVE LOGITS
upset
0.09
困
0.09
Amos
0.08
Daisy
0.08
herv
0.08
ారని
0.08
Kleid
0.08
amber
0.08
desagrad
0.07
discomfort
0.07
Activations Density 0.006%