Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

research papers

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-gpt-oss-20b/resid_post_layer_11/trainer_0

Dataset (Dashboard)

Various

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

awr

-0.09

醒

-0.08

 proclamation

-0.08

‼

-0.08

 Reflection

-0.07

 Pads

-0.07

 HUGE

-0.07

 Easily

-0.07

 Choose

-0.07

ères

-0.07

POSITIVE LOGITS

 studies

0.13

 papers

0.13

Studies

0.11

 topics

0.11

 Papers

0.10

 अध्य

0.10

 ಸಾಹಿತ್ಯ

0.10

papers

0.09

 literature

0.09

 journals

0.09

Activations Density 0.054%

No Known Activations

© Neuronpedia 2026

Privacy & Terms Blog GitHub Slack Twitter Contact