INDEX

Explanations

themes of denial and blindness to societal issues

New Auto-Interp

Configuration

Prompts (Dashboard)

24,576 prompts, 128 tokens each

Dataset (Dashboard)

cerebras/SlimPajama-627B

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 rodin

-0.08

æ³Ĭ

-0.07

Ã¡zd

-0.07

dech

-0.07

íĻľ

-0.07

ymm

-0.07

ë

-0.07

_canvas

-0.07

åĲĲ

-0.07

ymous

-0.07

POSITIVE LOGITS

 denial

0.13

 blindness

0.10

 blind

0.09

Den

0.08

 deny

0.08

 ignorance

0.08

 ignore

0.08

 until

0.08

-ignore

0.08

 blinds

0.08

Activations Density 0.045%