INDEX
Negative Logits
aac
-0.07
coastal
-0.07
Frankie
-0.07
relaciones
-0.07
Prompt
-0.07
Antoine
-0.07
David
-0.06
Est
-0.06
ieran
-0.06
Catherine
-0.06
POSITIVE LOGITS
{
↵
↵
↵0.07
<My
0.07
:↵↵↵↵
0.06
(column
0.06
casecmp
0.06
sucks
0.06
()↵
0.06
"]/
0.06
verbosity
0.06
advertiser
0.06
Activations Density 0.025%