Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

Recovery

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-gpt-oss-20b/resid_post_layer_11/trainer_0

Dataset (Dashboard)

Various

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 Kommun

-0.09

 কোনও

-0.08

 কোনো

-0.08

 कुनै

-0.08

 Russ

-0.08

 Rican

-0.07

 capitalist

-0.07

=\"

-0.07

 Communist

-0.07

 commun

-0.07

POSITIVE LOGITS

_utils

0.10

Utils

0.09

 bölüm

0.08

-utils

0.08

¶

0.08

misc

0.08

 વિભાગ

0.08

 Topics

0.08

.ts

0.08

.touch

0.07

Activations Density 0.024%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact