INDEX

Explanations

crucial

New Auto-Interp

Configuration

Prompts (Dashboard)

16,384 prompts, 128 tokens each

Dataset (Dashboard)

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 race

-0.06

è¿Ĳè¡ĮæĹ¶

-0.05

 Race

-0.05

åĽ½éĻħåĲĪä½ľ

-0.05

è´¡

-0.05

usta

-0.05

ust

-0.05

 competitive

-0.05

æ²¿

-0.05

å¹¸åŃĺèĢħ

-0.05

POSITIVE LOGITS

ritis

0.06

.SIZE

0.06

è¿ĽéĢĢ

0.06

Ð·Ð°ÑĢ

0.06

DEL

0.06

 sized

0.06

ellar

0.05

eltas

0.05

hil

0.05

à¸¢à¹īà¸²à¸¢

0.05

Activations Density 0.028%