Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

solar

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-gpt-oss-20b/resid_post_layer_11/trainer_0

Dataset (Dashboard)

Various

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

AMI

-0.08

 Diabetes

-0.08

ครับ

-0.08

.metro

-0.08

.$$

-0.07

бав

-0.07

چی

-0.07

 Rés

-0.07

 செய்யப்பட்ட

-0.07

Remark

-0.07

POSITIVE LOGITS

 inteira

0.09

cen

0.09

 निकल

0.08

 revolve

0.08

 brill

0.08

 starf

0.08

 compartments

0.08

ust

0.08

 trustees

0.08

 కాల

0.07

Activations Density 0.002%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact