INDEX
Negative Logits
aboard
-0.08
_regions
-0.08
bénéf
-0.08
trist
-0.07
manfaat
-0.07
Bins
-0.07
cert
-0.07
_step
-0.07
010
-0.07
_cert
-0.07
POSITIVE LOGITS
repente
0.08
Rok
0.08
art
0.08
कला
0.07
parody
0.07
România
0.07
stanza
0.07
Polish
0.07
разы
0.07
coes
0.07
Activations Density 0.003%