INDEX
Explanations
function calls with parentheses
New Auto-Interp
Negative Logits
'';
0.98
"";
0.98
'.';
0.96
';",
0.94
❞
0.93
{};0.90
;";
0.86
='';
0.83
="";
0.82
_;
0.82
POSITIVE LOGITS
())
3.09
)
2.99
.)
2.91
!)
2.89
):
2.87
?)
2.81
[])
2.81
).
2.79
)。
2.70
"")
2.69
Activations Density 0.498%