Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

about

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-gpt-oss-20b/resid_post_layer_11/trainer_0

Dataset (Dashboard)

Various

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 Spiel

-0.08

 ответа

-0.08

 التنفيذ

-0.08

 spiel

-0.08

 المعلومات

-0.08

 cór

-0.08

 કોર્�

-0.08

 thông

-0.08

 표현

-0.07

 dennoch

-0.07

POSITIVE LOGITS

 vaccination

0.09

主人

0.09

 hikers

0.09

 refugees

0.09

 students

0.08

 superheroes

0.08

 empowerment

0.08

 pilgrims

0.08

 bull

0.08

 rising

0.08

Activations Density 0.042%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact