Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

URLs in various formats

oai_token-act-pair · gpt-4o-mini Triggered by @bot

New Auto-Interp

Configuration

Prompts (Dashboard)

24,576 prompts, 128 tokens each

Dataset (Dashboard)

cerebras/SlimPajama-627B

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

ovit

-0.08

atters

-0.06

Pom

-0.06

oker

-0.06

iven

-0.06

retty

-0.06

Tr

-0.06

ritis

-0.06

 Prest

-0.06

fo

-0.06

POSITIVE LOGITS

ITTE

0.07

åŃĿ

0.06

otos

0.06

abee

0.06

etail

0.06

aston

0.06

ÏħÏĦÏĮ

0.06

mud

0.06

ØºÙĦ

0.06

ÙĦÙĬÙĩ

0.06

Activations Density 0.010%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact