INDEX

Explanations

misinterpreting or misunderstanding information

New Auto-Interp

Configuration

Prompts (Dashboard)

24,576 prompts, 128 tokens each

Dataset (Dashboard)

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

urlopen

-0.91

 roues

-0.88

endere

-0.78

 نظر

-0.76

 бассей

-0.75

лада

-0.75

 призна

-0.73

úgó

-0.73

 együtt

-0.73

mvp

-0.73

POSITIVE LOGITS

 misinterpreted

2.92

 misunderstood

2.73

 interpretation

2.73

mis

2.66

 interpreted

2.59

 misunder

2.55

 misunderstand

2.50

 interpretations

2.42

interpretation

2.41

 interprets

2.33

Activations Density 0.056%