Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

debunking rumors

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-gpt-oss-20b/resid_post_layer_11/trainer_0

Dataset (Dashboard)

Various

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

וכל

-0.08

urtout

-0.08

 Enables

-0.08

depending

-0.08

 الذى

-0.07

enable

-0.07

 მაღალი

-0.07

 Bege

-0.07

โมชั่น

-0.07

ด้วย

-0.07

POSITIVE LOGITS

 никаких

0.12

 هیچ

0.12

 keine

0.11

 keinerlei

0.11

 eikä

0.11

 heç

0.11

 unrelated

0.11

 weder

0.10

，没有

0.10

 geen

0.10

Activations Density 0.059%

No Known Activations

© Neuronpedia 2026

Privacy & Terms Blog GitHub Slack Twitter Contact