INDEX
Explanations
punctuation marks, especially sentences ending with periods and question marks
punctuation marks, especially periods and question marks
New Auto-Interp
Negative Logits
存于互联网档案馆
-0.75
Lyt
-0.67
hyd
-0.63
Sante
-0.63
intervento
-0.62
mitsubishi
-0.62
ctile
-0.61
gebob
-0.61
pośred
-0.61
̯
-0.60
POSITIVE LOGITS
。
1.57
)。
1.22
。
1.11
:
1.07
,
1.06
!
1.03
)。
1.03
।
0.98
、
0.98
.。
0.97
Activations Density 0.055%