INDEX
Negative Logits
$+$
0.75
$+\
0.73
(+
0.70
+'
0.69
$+
0.66
/+
0.65
nonexistent
0.65
/
0.65
.+
0.65
%+
0.63
POSITIVE LOGITS
_
1.81
-
1.79
_-
1.69
-_
1.52
\_
1.46
‑
1.37
__
1.30
ـ
1.29
-
1.27
-$
1.26
Activations Density 0.008%
$+$
$+\
(+
+'
$+
/+
nonexistent
/
.+
%+
_
-
_-
-_
\_
‑
__
ـ
-
-$