INDEX
Negative Logits
binge
-0.08
allt
-0.08
Ottawa
-0.07
ранс
-0.07
єн
-0.07
Nl
-0.07
premiere
-0.07
Hub
-0.07
blanche
-0.07
نب
-0.07
POSITIVE LOGITS
digits
0.10
digits
0.10
ಪದ
0.09
-digit
0.09
Digits
0.09
dí
0.09
gcd
0.08
diper
0.08
_digits
0.08
digit
0.08
Activations Density 0.005%