Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

music

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-gpt-oss-20b/resid_post_layer_11/trainer_0

Dataset (Dashboard)

Various

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 Molecular

-0.08

 transferencia

-0.08

 fist

-0.08

 mechan

-0.07

 Training

-0.07

 Tutorials

-0.07

feren

-0.07

 Maintenance

-0.07

빨

-0.07

 transfert

-0.07

POSITIVE LOGITS

 acclaimed

0.09

 quase

0.08

 casi

0.08

 предст

0.08

 כס

0.08

 magnifiques

0.08

 karya

0.08

 Joshua

0.08

 almost

0.08

 Scott

0.08

Activations Density 0.017%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact