Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

Miami Beach Art Deco

np_acts-logits-general · gemini-2.5-flash-lite

New Auto-Interp

Configuration

google/gemma-scope-2-27b-it/resid_post/layer_53_width_262k_l0_medium

Prompts (Dashboard)

238,145 prompts, 512 tokens each

Dataset (Dashboard)

lmsys + oasst1

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

Mia

0.41

Intercept

0.41

UserId

0.41

Secret

0.40

mia

0.40

imi

0.38

secret

0.38

檤

0.38

mia

0.38

amı

0.37

POSITIVE LOGITS

 Collins

0.75

 Lincoln

0.69

 Alton

0.69

Collins

0.68

 Espan

0.62

 Española

0.61

Lincoln

0.59

Lum

0.57

Alton

0.57

 Deco

0.56

Activations Density 0.002%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact