INDEX
Negative Logits
B
-0.08
º
-0.08
ª
-0.07
polit
-0.07
fech
-0.07
_fore
-0.07
är
-0.07
politely
-0.07
Zip
-0.07
.fore
-0.07
POSITIVE LOGITS
troubles
0.09
pdo
0.08
parlant
0.07
uminous
0.07
Chu
0.07
обязательно
0.07
troubled
0.07
anfani
0.07
sửa
0.07
võib
0.07
Activations Density 0.013%