Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

circle radii calculations

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-gpt-oss-20b/resid_post_layer_11/trainer_0

Dataset (Dashboard)

Various

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

fruit

-0.08

 guru

-0.08

/project

-0.08

特色

-0.08

Guru

-0.08

-width

-0.08

shine

-0.08

_hosts

-0.07

 humild

-0.07

ightly

-0.07

POSITIVE LOGITS

 acos

0.09

 grieving

0.08

 Cure

0.08

 Clip

0.08

mwy

0.08

 deutschen

0.08

დინარე

0.08

 toirt

0.08

 drowning

0.08

 computes

0.08

Activations Density 0.015%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact