Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

and

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-gpt-oss-20b/resid_post_layer_11/trainer_0

Dataset (Dashboard)

Various

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 jewel

-0.09

ellem

-0.08

šanas

-0.08

ással

-0.08

Forum

-0.08

nett

-0.07

 profils

-0.07

 TODAY

-0.07

Contenido

-0.07

uzzle

-0.07

POSITIVE LOGITS

 исправ

0.09

 mistakes

0.08

 hata

0.08

 أسباب

0.08

 reasons

0.08

 corrections

0.08

ww

0.07

 Reasons

0.07

 причины

0.07

ೆಗಳ

0.07

Activations Density 0.005%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact