INDEX
Negative Logits
screw
-0.08
\t
-0.08
Pub
-0.07
_pub
-0.07
الس
-0.07
fro
-0.07
fin
-0.07
gue
-0.07
trunk
-0.07
grave
-0.07
POSITIVE LOGITS
overst
0.08
Upt
0.08
690
0.08
epit
0.07
ಂಪ
0.07
ುಂಬ
0.07
Hands
0.07
Advice
0.07
Reyn
0.07
而言
0.07
Activations Density 0.150%