INDEX
Negative Logits
↵↵
3.30
↵↵↵↵
2.28
↵↵↵↵↵
1.91
↵↵↵
1.89
↵↵↵↵↵↵
1.70
↵↵↵↵↵↵↵↵
1.66
↵↵↵↵↵↵↵↵↵↵↵↵↵↵
1.58
↵↵↵↵↵↵↵↵↵↵
1.57
↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵
1.48
<start_of_image>
1.46
POSITIVE LOGITS
ẞ
1.64
.')
1.18
).}
1.11
ẞ
1.08
{@1.06
.)
1.05
.")
1.02
$.}
1.02
.');
1.01
.).
0.97
Activations Density 0.152%