verbs indicating demonstration or validation of claims

New Auto-Interp

Configuration

Prompts (Dashboard)

24,576 prompts, 128 tokens each

Dataset (Dashboard)

cerebras/SlimPajama-627B

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

bose

-0.08

inish

-0.07

ropolis

-0.07

åĭ¢

-0.07

omo

-0.07

ominator

-0.07

 MatSnackBar

-0.07

inan

-0.07

annels

-0.07

aura

-0.07

POSITIVE LOGITS

athers

0.07

enton

0.06

 popular

0.06

ved

0.06

æŀľ

0.06

agma

0.06

ource

0.06

aska

0.06

Activations Density 0.008%