Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

a

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-gpt-oss-20b/resid_post_layer_11/trainer_0

Dataset (Dashboard)

Various

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 "";
↵
↵

-0.08

 "",
↵

-0.08

名無し

-0.08

 ""
↵

-0.08

ογ

-0.07

how

-0.07

"",

-0.07

 διαφορε

-0.07

ңа

-0.07

ﾜ

-0.07

POSITIVE LOGITS

 with

0.08

 području

0.07

 determinadas

0.07

worthiness

0.07

pered

0.07

വുമായി

0.07

  ↵↵

0.07

 ทุก

0.07

 ↵↵

0.07

0.06

Activations Density 31.460%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact