Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

asking for clarification or specifics

np_acts-logits-general · gemini-2.5-flash-lite

New Auto-Interp

Configuration

google/gemma-scope-2-4b-pt/resid_post/layer_29_width_16k_l0_medium

Prompts (Dashboard)

392,802 prompts, 256 tokens each

Dataset (Dashboard)

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

本発明

0.80

ﬀ

0.73

彧

0.72

มนเชสเตอร์

0.71

婇

0.68

ાલુ

0.65

岱

0.63

 автоматлары

0.63

爣

0.61

佺

0.59

POSITIVE LOGITS

5.67

？

5.39

??

5.34

???

5.20

?,

5.18

5.17

?!

5.17

?:

5.12

?????

5.10

?(

5.09

Activations Density 1.955%

No Known Activations

© Neuronpedia 2026

Privacy & Terms Blog GitHub Slack Twitter Contact