Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

multiple languages

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-gpt-oss-20b/resid_post_layer_11/trainer_0

Dataset (Dashboard)

Various

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

Ae

-0.08

 sør

-0.07

uh

-0.07

 ವಿ�

-0.07

abe

-0.07

dbg

-0.07

brev

-0.07

Ví

-0.07

 Philip

-0.07

aution

-0.07

POSITIVE LOGITS

了一

0.10

了

0.09

ছে

0.09

ening

0.09

ાવે

0.09

ுகிறது

0.09

ించే

0.09

 করছে

0.09

 रखते

0.09

ப்படும்

0.08

Activations Density 0.394%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact