INDEX

Explanations

Hydro

New Auto-Interp

Configuration

Prompts (Dashboard)

16,384 prompts, 128 tokens each

Dataset (Dashboard)

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 miss

-0.84

 submit

-0.81

 SUBMIT

-0.69

submission

-0.69

TagMode

-0.69

UrlResolution

-0.69

submissions

-0.68

 InputDecoration

-0.68

TintMode

-0.68

 Submit

-0.67

POSITIVE LOGITS

te

0.73

logical

0.71

ma

0.65

se

0.60

ch

0.59

top

0.59

ta

0.58

tic

0.58

ble

0.57

making

0.57

Activations Density 0.236%