INDEX
Negative Logits
'])) ↵
-0.25
"]))↵
-0.25
])) ↵
-0.24
")))↵
-0.24
())))↵
-0.24
']))↵
-0.23
}))↵
-0.22
]))↵
-0.22
])))↵
-0.22
')))↵
-0.21
POSITIVE LOGITS
));↵
0.45
));↵↵
0.39
()));↵
0.36
'));↵
0.35
"));↵
0.34
));↵
0.34
));↵//
0.33
));
0.33
)); ↵
0.32
_));↵
0.32
Activations Density 0.009%