INDEX
Explanations
references to scientific concepts and methodologies
New Auto-Interp
Negative Logits
<eos>
-1.28
↵↵
-1.11
,
-0.95
↵↵↵
-0.95
),
-0.88
)
-0.81
;
-0.81
↵
-0.79
↵↵↵↵
-0.77
-
-0.76
POSITIVE LOGITS
للمعارف
1.01
GenerationType
0.97
脚注の使い方
0.91
".
0.89
дописавши
0.88
.'.
0.88
》.
0.86
'".
0.86
.".
0.86
تضيفلها
0.84
Activations Density 0.643%