INDEX
Negative Logits
Agency
-0.08
Vog
-0.08
rind
-0.07
madura
-0.07
famp
-0.07
Pl
-0.07
tapas
-0.07
巡
-0.07
соглас
-0.07
成熟
-0.07
POSITIVE LOGITS
Trig
0.09
pantal
0.08
Din
0.08
allocation
0.08
Din
0.08
shoot
0.07
Cox
0.07
.gen
0.07
expl
0.07
breeding
0.07
Activations Density 0.024%