INDEX
Negative Logits
Fuck
-0.08
captiv
-0.08
mits
-0.08
инсп
-0.08
syringe
-0.08
screws
-0.08
whe
-0.07
.Dict
-0.07
yacc
-0.07
_Integer
-0.07
POSITIVE LOGITS
расходов
0.08
działal
0.08
甚至
0.08
uted
0.07
executivo
0.07
नौकरी
0.07
uelo
0.07
acit
0.07
werknemers
0.07
-gr
0.07
Activations Density 0.009%