INDEX
Explanations
evaluate statements ending sentences
New Auto-Interp
Negative Logits
いますが
0.51
かもしれませんが
0.45
と思いますが
0.45
ますが
0.44
していますが
0.41
zwar
0.39
がありますが
0.38
】【
0.38
きましたが
0.37
indiquant
0.35
POSITIVE LOGITS
.”
0.59
."
0.54
.
0.51
។
0.49
؟
0.48
😏
0.47
。
0.47
”.
0.46
።
0.46
!
0.44
Activations Density 0.185%