INDEX

Explanations

interrogative words and phrases

New Auto-Interp

Configuration

Prompts (Dashboard)

24,576 prompts, 128 tokens each

Dataset (Dashboard)

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits



-2.69

。「

-2.52

<td>

-2.42

趼

-2.41

",

-2.39

 todėl

-2.34

廕

-2.33

</b>

-2.30

谖

-2.30

-2.28

POSITIVE LOGITS

</em>

2.86

</strong>

2.50

～

2.41

みると

2.41

有不少

2.38

齶

2.36

</h3>

2.34

見ると

2.27

見ても

2.27

什么的

2.19

Activations Density 0.002%