Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

the

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-gpt-oss-20b/resid_post_layer_11/trainer_0

Dataset (Dashboard)

Various

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

sz

-0.08

 whimsical

-0.08

-ups

-0.08

 Bean

-0.07

 целях

-0.07

 sant

-0.07

 meticulous

-0.07

 fréqu

-0.07

 penser

-0.07

ARRIER

-0.07

POSITIVE LOGITS

Formula

0.10

_formula

0.09

 formula

0.09

formula

0.08

 सूत्र

0.08

 рассчиты

0.08

omod

0.08

콘

0.08

公式

0.08

 Formula

0.08

Activations Density 0.009%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact