INDEX

Explanations

deletion or destruction

New Auto-Interp

Configuration

Prompts (Dashboard)

24,576 prompts, 128 tokens each

Dataset (Dashboard)

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 estrena

-1.25

𐀀

-1.21

 damen

-1.20

 Traité

-1.13

 formen

-1.10

 confirmó

-1.09

向了

-1.09

 volverá

-1.08

 mantend

-1.05

 prevé

-1.05

POSITIVE LOGITS

or

1.28

so

1.08

if

0.97

 diligent

0.94

 razem

0.93

 chiam

0.91

 piernas

0.91

 partial

0.91

no

0.90

なんですよ

0.89

Activations Density 0.002%