INDEX
Explanations
technical terms and annotations in code or documentation
New Auto-Interp
Negative Logits
--
-0.64
—
-0.57
[\
-0.53
--.
-0.52
--,
-0.51
---
-0.50
----
-0.50
—.
-0.50
(
-0.50
----
-0.50
POSITIVE LOGITS
"/>
1.01
="+
0.91
awtextra
0.87
'/>
0.73
/'+
0.69
שוליים
0.69
}}/>
0.68
/>
0.66
0.65
/"+
0.64
Activations Density 0.107%