Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

Wick

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-gpt-oss-20b/resid_post_layer_11/trainer_0

Dataset (Dashboard)

Various

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 advise

-0.08

�

-0.08

 memories

-0.07

েদন

-0.07

 svoj

-0.07

 inkluder

-0.07

 bind

-0.07

 bless

-0.07

 theo

-0.07

dream

-0.07

POSITIVE LOGITS

 churrasqueira

0.08

 تعامل

0.08

icacité

0.08

 Logitech

0.08

 conflits

0.08

动车

0.08

 commerces

0.08

.Priority

0.07

 Palestina

0.07

decltype

0.07

Activations Density 0.001%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact