Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

kinetic

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-gpt-oss-20b/resid_post_layer_11/trainer_0

Dataset (Dashboard)

Various

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 stuck

-0.08

zac

-0.08

 hooked

-0.08

 texting

-0.07

 dettag

-0.07

寻

-0.07

 clique

-0.07

 curated

-0.07

 hung

-0.07

Notifications

-0.07

POSITIVE LOGITS

 rotational

0.08

 حرارة

0.08

 тан

0.08

 convertible

0.08

 rental

0.07

 latent

0.07

 Тан

0.07

flashdata

0.07

 водитель

0.07

Rental

0.07

Activations Density 0.003%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact