INDEX

Explanations

phrases indicating perplexity or uncertainty regarding situations or events

New Auto-Interp

Configuration

Prompts (Dashboard)

24,576 prompts, 128 tokens each

Dataset (Dashboard)

cerebras/SlimPajama-627B

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

stagram

-0.07

ãģłãģ£ãģ¦

-0.07

ãĤ¸ãĤ¢

-0.07

ernel

-0.07

 ÙħØ®ØªØµØ§Øª

-0.06

ãģĪãģ°

-0.06

oystick

-0.06

oret

-0.06

Ã¡la

-0.06

uffman

-0.06

POSITIVE LOGITS

 somehow

0.20

 Somehow

0.14

 somew

0.12

 seems

0.08

 apparently

0.08

 somewhere

0.08

 seem

0.07

 irgend

0.07

 manages

0.07

 seemed

0.07

Activations Density 0.030%