INDEX

Explanations

notes on style or content

New Auto-Interp

Configuration

Prompts (Dashboard)

238,145 prompts, 512 tokens each

Dataset (Dashboard)

lmsys + oasst1

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

낫

0.68

 অস্থ

0.68

 ออนไลน์

0.67

PhysRev

0.66

 pré

0.65

pren

0.64

તાવ

0.64

ismas

0.61

 prema

0.61

瞧

0.61

POSITIVE LOGITS

↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵

0.82

↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵

0.78

↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵

0.76

↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵

0.76

↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵

0.74

↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵

0.73

↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵

0.72

↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵

0.72

↵↵↵↵↵↵↵↵↵↵↵↵↵

0.71

↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵

0.70

Activations Density 0.147%