© Neuronpedia 2026

Privacy & Terms Blog GitHub Slack Twitter Contact

Neuronpedia

Natural Language

NEW Assistant AxisNEW Circuit TracerUPDATESteer SAE Evals ExportsAPI Community Blog Privacy & Terms Contact

Vector Label

refusal (Arditi et al. 2024)

Model

gemma-2-2b-it

Layer #

15

Steering Hook

blocks.15.hook_resid_pre

Steering Strength

0.25

Uploader

bot-neuronpedia

Created At

11/20/2024 9:49:19 AM

Raw Vector

Actions

Explanations

No Explanations Found

New Auto-Interp

Top Features by Cosine Similarity

Embeds

Show PlotsShow ExplanationShow ActivationsShow Test FieldShow SteerShow Link

IFrame

Link

Not in Any Lists

No Comments

No Known Activations