INDEX

Explanations

2

New Auto-Interp

Configuration

Prompts (Dashboard)

16,384 prompts, 128 tokens each

Dataset (Dashboard)

monology/pile-uncopyrighted

Embeds

PlotsExplanationShow Test FieldDefault Test Text

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 lock

-0.30

 Lock

-0.30

 locks

-0.29

locking

-0.28

éĶģ

-0.27

(lock

-0.27

Locker

-0.27

 sweeps

-0.27

 draw

-0.26

çĶ»

-0.26

POSITIVE LOGITS

çªĹå¤ĸ

0.27

çªģçł´

0.26

edition

0.25

orges

0.25

åĳ¼åĲ¸

0.25

ç©º

0.24

 Print

0.24

har

0.24

 dish

0.24

Ãį

0.23

Activations Density 0.906%