INDEX
Negative Logits
seductive
-0.09
peine
-0.08
halt
-0.08
Caroline
-0.07
unnamed
-0.07
electoral
-0.07
bite
-0.07
eding
-0.07
getir
-0.07
Hoch
-0.07
POSITIVE LOGITS
spaced
0.09
lined
0.08
obč
0.08
locations
0.08
смерти
0.07
مث
0.07
размещ
0.07
Obst
0.07
Entfernung
0.07
Mga
0.07
Activations Density 0.019%