INDEX

Explanations

research, data, projects

New Auto-Interp

Configuration

Prompts (Dashboard)

24,576 prompts, 128 tokens each

Dataset (Dashboard)

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

enal

-0.80

 сор

-0.75

ourage

-0.75

lifer

-0.73

展览

-0.72

⣿⣿

-0.72

bsd

-0.72

Certainly

-0.71

 revenues

-0.71

 Baths

-0.71

POSITIVE LOGITS

attività

0.79

 foreground

0.79

ected

0.78

\}$.

0.77

conducted

0.77

Keen

0.76

 мысль

0.76

 соста

0.75

하다

0.74

ventes

0.74

Activations Density 0.035%