INDEX
Negative Logits
regres
-0.08
дат
-0.08
birth
-0.08
birthplace
-0.08
regulations
-0.07
Brock
-0.07
зад
-0.07
ente
-0.07
irrational
-0.07
Bran
-0.07
POSITIVE LOGITS
.cfg
0.09
Histogram
0.07
τώ
0.07
yose
0.07
aux
0.07
Coins
0.07
′
0.07
lut
0.07
işl
0.07
gesto
0.07
Activations Density 0.001%