Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

answering questions

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-gpt-oss-20b/resid_post_layer_11/trainer_0

Dataset (Dashboard)

Various

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

ئات

-0.08

Can't

-0.08

十四

-0.07

 СО

-0.07

_connection

-0.07

 fourteen

-0.07

ван

-0.07

_application

-0.07

 CONNECTION

-0.07

ій

-0.07

POSITIVE LOGITS

 petals

0.08

 여러

0.08

 Nearby

0.08

 breaths

0.08

 հաջ

0.08

 nearby

0.08

 subsequent

0.08

 meerdere

0.08

两个

0.08

 ڈال

0.08

Activations Density 0.497%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact