Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

druid and druidic

np_acts-logits-general · gemini-2.5-flash-lite

New Auto-Interp

Configuration

google/gemma-scope-2-4b-it/resid_post/layer_29_width_262k_l0_medium

Prompts (Dashboard)

238,145 prompts, 512 tokens each

Dataset (Dashboard)

lmsys + oasst1

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 شکست

0.78

 imput

0.76

δη

0.75

Ско

0.70

绍

0.69

喘

0.69

購

0.68

ন্তু

0.67

стый

0.66

气

0.66

POSITIVE LOGITS

pal

1.05

gged

0.98

ids

0.95

idic

0.90

órd

0.89

IDs

0.86

Dru

0.85

 hillside

0.84

Dru

0.83

یدہ

0.83

Activations Density 0.001%

No Known Activations

© Neuronpedia 2026

Privacy & Terms Blog GitHub Slack Twitter Contact