INDEX
Negative Logits
prepre
-0.09
motivating
-0.09
näht
-0.08
roh
-0.08
organisiert
-0.08
Service
-0.08
Initialise
-0.07
motivates
-0.07
ago
-0.07
ova
-0.07
POSITIVE LOGITS
agreements
0.08
ewar
0.08
deixar
0.08
छोड़
0.07
negoci
0.07
neen
0.07
הענ
0.07
agreement
0.07
utate
0.07
urther
0.07
Activations Density 0.001%