INDEX

Explanations

Jonas

New Auto-Interp

Configuration

Prompts (Dashboard)

16,384 prompts, 128 tokens each

Dataset (Dashboard)

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 handleMessage

-0.66

Jonas

-0.60

 raisin

-0.60

 Jonas

-0.59

naires

-0.57

 cypress

-0.56

chans

-0.56

 raisins

-0.56

 wedges

-0.55

 frog

-0.54

POSITIVE LOGITS

WriteBarrier

0.54

 compét

0.52

Manbalar

0.51

 död

0.50

tonode

0.50

 fraî

0.49

 actuelles

0.49

 culturelles

0.49

 tillbaka

0.47

 européennes

0.47

Activations Density 0.001%