Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

ager/agers

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

Prompts (Dashboard)

16,384 prompts, 128 tokens each

Dataset (Dashboard)

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

se

-1.30

ge

-0.94

agers

-0.92

ager

-0.77

seye

-0.77

ge

-0.77

+#+#

-0.75

-0.73

-0.73

-0.71

POSITIVE LOGITS

 виправивши

0.74

IVEREF

0.63

Autoritní

0.60

glises

0.60

titleMargin

0.59

 كومونز

0.55

 المعيارى

0.55

فایل‌لار

0.54

✨:

0.54

Biographie

0.53

Activations Density 0.161%

No Known Activations

© Neuronpedia 2026

Privacy & Terms Blog GitHub Slack Twitter Contact