Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

history lessons

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-gpt-oss-20b/resid_post_layer_11/trainer_0

Dataset (Dashboard)

Various

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

ables

-0.08

(()

-0.08

dap

-0.08

DA

-0.07

 declares

-0.07

 dreamy

-0.07

 mezcla

-0.07

 integrating

-0.07

ADV

-0.07

_ADV

-0.07

POSITIVE LOGITS

 precedent

0.14

तिहास

0.12

 lessons

0.12

历史

0.12

 históricos

0.12

 historical

0.11

 Lessons

0.11

 ചരിത്ര

0.11

歴

0.11

 Historical

0.11

Activations Density 0.085%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact