INDEX
Negative Logits
करण
-0.08
less
-0.07
�
-0.07
списка
-0.07
dereg
-0.07
णी
-0.07
削
-0.07
verantwort
-0.07
provinc
-0.07
нез
-0.07
POSITIVE LOGITS
automaticamente
0.09
Sympathy
0.09
/hour
0.08
automatically
0.08
.gold
0.08
أعرف
0.08
Automatically
0.08
acyjne
0.08
automáticamente
0.08
Subtype
0.08
Activations Density 0.002%