Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

currency

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-gpt-oss-20b/resid_post_layer_11/trainer_0

Dataset (Dashboard)

Various

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 Beide

-0.08

ırl

-0.07

 камера

-0.07

 commissioning

-0.07

 эз

-0.07

Beg

-0.07

 comunidade

-0.07

лаш

-0.07

angka

-0.07

 устанавли

-0.07

POSITIVE LOGITS

 الهند

0.09

 applied

0.08

 booster

0.08

חד

0.08

变化

0.08

	
↵	
↵

0.08

 बदल

0.08

 अन

0.08

.root

0.07

 nedeniyle

0.07

Activations Density 0.004%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact