INDEX

Explanations

initiating model responses

New Auto-Interp

Configuration

Prompts (Dashboard)

238,145 prompts, 512 tokens each

Dataset (Dashboard)

lmsys + oasst1

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 faiblement

0.32

 punctatis

0.31

<unused98>

0.30

 demethyl

0.29

زار

0.29

 unwillingness

0.28

 cambiamento

0.28

 pessim

0.28

ylobacter

0.28

 பதில்

0.27

POSITIVE LOGITS

Getting

0.30

↵↵

0.29

Get

0.28

aming

0.28

Be

0.28

Luxury

0.28

о

0.28

Get

0.27

 luxury

0.27

 Getting

0.27

Activations Density 0.193%