INDEX
Explanations
numerical data and statistical information
New Auto-Interp
Negative Logits
?」
-0.69
!」
-0.69
?
-0.53
()?
-0.52
:「
-0.49
?");
-0.46
!
-0.46
?”
-0.45
!”
-0.43
:“
-0.43
POSITIVE LOGITS
!
1.17
;
1.12
!)
1.02
:
0.97
!"
0.94
:
0.88
;
0.85
:</
0.85
:}
0.84
!”
0.84
Activations Density 0.369%