INDEX
Negative Logits
Sheep
-0.09
gcd
-0.09
IMM
-0.09
bookshelf
-0.09
yaa
-0.09
ya
-0.08
棋
-0.08
चर
-0.08
芸
-0.08
dx
-0.08
POSITIVE LOGITS
otim
0.08
miss
0.08
разб
0.08
ден
0.07
кра
0.07
infr
0.07
-ha
0.07
cias
0.07
hij
0.07
issue
0.07
Activations Density 0.011%