INDEX

Explanations

free or private contexts

New Auto-Interp

Configuration

Prompts (Dashboard)

238,145 prompts, 512 tokens each

Dataset (Dashboard)

lmsys + oasst1

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 дове

0.46

 социальной

0.44

 ТО

0.43

 известных

0.42

 размера

0.41

illow

0.41

借り

0.40

 Best

0.39

 Coastal

0.39

兑

0.38

POSITIVE LOGITS

 afterward

0.48

 mayhem

0.46

 Afterward

0.42

 lessened

0.42

 meteen

0.39

 craziness

0.39

 immediately

0.38

 damaging

0.38

 poked

0.38

 causation

0.38

Activations Density 0.003%