INDEX
Negative Logits
pursuant
-0.08
011
-0.08
legales
-0.07
legally
-0.07
/legal
-0.07
.Rule
-0.07
leden
-0.07
法人
-0.07
ikun
-0.07
ůsob
-0.07
POSITIVE LOGITS
HEL
0.08
salv
0.08
beschäd
0.08
informazioni
0.08
olj
0.07
które
0.07
جدول
0.07
(saved
0.07
saved
0.07
BOOT
0.07
Activations Density 0.003%