Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

fulness

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-gpt-oss-20b/resid_post_layer_11/trainer_0

Dataset (Dashboard)

Various

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

раг

-0.09

 crafted

-0.08

 republican

-0.08

 ಕಾರ್ಯಕ್ರಮ

-0.08

хо

-0.08

न्होंने

-0.08

abb

-0.08

 entretien

-0.07

နိုင်

-0.07

�

-0.07

POSITIVE LOGITS

vine

0.08

brit

0.08

Pen

0.07

 الفي

0.07

 existential

0.07

β

0.07

net

0.07

 germ

0.07

SUR

0.07

 brainstorm

0.07

Activations Density 0.000%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact