Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

chemistry and biology

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-gpt-oss-20b/resid_post_layer_11/trainer_0

Dataset (Dashboard)

Various

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 mattresses

-0.08

 retains

-0.08

년

-0.08

 excuse

-0.07

비

-0.07

Retention

-0.07

Voice

-0.07

�

-0.07

年

-0.07

-ret

-0.07

POSITIVE LOGITS

 catal

0.09

قيام

0.08

 সম্ভ

0.08

èce

0.08

 Clark

0.08

 участие

0.08

 destructive

0.08

OH

0.08

 অভিযান

0.08

 हमला

0.08

Activations Density 0.005%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact