INDEX

Explanations

statements expressing skepticism about common beliefs or assumptions

New Auto-Interp

Configuration

Prompts (Dashboard)

24,576 prompts, 128 tokens each

Dataset (Dashboard)

cerebras/SlimPajama-627B

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

loat

-0.07

usch

-0.06

ë³

-0.06

ona

-0.06

ington

-0.06

universal

-0.06

Ã«r

-0.06

ukt

-0.06

nia

-0.06

IIC

-0.06

POSITIVE LOGITS

 Transparency

0.12

 transparency

0.12

 transparent

0.09

 Transparent

0.09

transparent

0.08

Transparent

0.08

æ¸ħæ¥ļ

0.08

 accountability

0.07

-transparent

0.07

 Accountability

0.07

Activations Density 0.060%