INDEX

Explanations

contents, metadata, titles

New Auto-Interp

Configuration

Prompts (Dashboard)

24,576 prompts, 128 tokens each

Dataset (Dashboard)

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

ennial

-0.88

EClass

-0.86

?>

-0.85

predictions

-0.83

<th>

-0.82

asons

-0.81

閒

-0.80

fiore

-0.79

!';

-0.79

ricle

-0.79

POSITIVE LOGITS

Invited

0.85

Evaluating

0.81

Banned

0.81

wają

0.76

Ceci

0.74

Attractions

0.73

Forbidden

0.73

 mung

0.73

Bicycle

0.73

Nao

0.72

Activations Density 0.000%