INDEX

Explanations

introduces a key term or concept

New Auto-Interp

Configuration

Prompts (Dashboard)

238,145 prompts, 512 tokens each

Dataset (Dashboard)

lmsys + oasst1

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

0.78

0.64

0.62

’

0.60

0.58

↵

0.55

0.53

">

0.53

id

0.53

0.52

POSITIVE LOGITS

<unused205>

0.65

<unused1810>

0.65

<unused292>

0.64

<unused734>

0.62

<unused626>

0.62

 biosynthesis

0.61

<unused1861>

0.61

㚅

0.59

<unused273>

0.59

<unused577>

0.59

Activations Density 0.002%