INDEX

Explanations

phrases that indicate ambiguity or vagueness

New Auto-Interp

Configuration

Prompts (Dashboard)

24,576 prompts, 128 tokens each

Dataset (Dashboard)

cerebras/SlimPajama-627B

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

enberg

-0.06

unal

-0.06

enal

-0.06

 mell

-0.06

à¸¡à¸Ń

-0.06

 Watt

-0.06

illon

-0.06

 dikke

-0.06

ourg

-0.05

:Boolean

-0.05

POSITIVE LOGITS

 vague

0.14

vag

0.13

 broad

0.12

 general

0.11

 generic

0.10

-general

0.10

generic

0.10

 specificity

0.10

 konkrÃ©t

0.10

general

0.10

Activations Density 0.074%