INDEX
Negative Logits
<select
-0.07
Gates
-0.07
debated
-0.07
_misc
-0.06
Philip
-0.06
winter
-0.06
lotion
-0.06
Jos
-0.06
(filename
-0.06
한국
-0.06
POSITIVE LOGITS
+b
0.07
}, ↵
0.07
'(
0.07
=m
0.07
ABCDEFGHI
0.06
ichi
0.06
\")
0.06
;} ↵
0.06
放
0.06
,w
0.06
Activations Density 0.079%