INDEX
Negative Logits
fake
-0.08
Prestige
-0.08
hl
-0.08
hl
-0.07
stochastic
-0.07
بهره
-0.07
środ
-0.07
ogi
-0.07
prestige
-0.07
scaling
-0.07
POSITIVE LOGITS
молодых
0.08
.Bl
0.08
Falle
0.08
.idea
0.08
Commons
0.08
Amendment
0.08
념
0.08
잔
0.08
.Activity
0.08
ুণ
0.08
Activations Density 0.002%