INDEX
Explanations
punctuation or formatting indicators
New Auto-Interp
Negative Logits
etcétera
0.49
之类的
0.45
میتوان
0.43
等等
0.41
といった
0.40
இங்கே
0.40
ebenso
0.40
इत्यादि
0.40
disini
0.40
ல்லாம்
0.39
POSITIVE LOGITS
|
0.57
)([
0.52
&
0.50
—
0.50
–
0.48
၊
0.47
。[
0.47
)[
0.45
+[
0.45
/[
0.45
Activations Density 0.057%