INDEX
Negative Logits
inferior
-0.09
markup
-0.09
nist
-0.08
ś
-0.08
Fram
-0.08
신문
-0.08
Denk
-0.08
ferencia
-0.08
Publishers
-0.08
-paced
-0.08
POSITIVE LOGITS
Rewards
0.08
rewards
0.08
Participation
0.08
photons
0.08
HB
0.07
participation
0.07
Reward
0.07
Participation
0.07
theta
0.07
beaut
0.07
Activations Density 0.001%