INDEX
Negative Logits
decisive
-0.09
etched
-0.08
proponents
-0.08
合理
-0.07
Britney
-0.07
stadium
-0.07
aforementioned
-0.07
drastic
-0.07
babys
-0.07
Samuel
-0.07
POSITIVE LOGITS
tog
0.07
}↵↵
0.07
0.07
wit
0.07
hoi
0.07
reads
0.07
↵↵
0.07
Gren
0.07
consist
0.07
local
0.07
Activations Density 0.052%