Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

ranges and combinations

np_acts-logits-general · gemini-2.5-flash-lite

New Auto-Interp

Configuration

google/gemma-scope-2-27b-it/resid_post/layer_31_width_262k_l0_medium

Prompts (Dashboard)

238,145 prompts, 512 tokens each

Dataset (Dashboard)

lmsys + oasst1

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

ו

0.44

 Brug

0.44

 ذریعہ

0.44

 Juillet

0.43

 Schalt

0.43

 sebag

0.42

 Michal

0.42

Vý

0.42

Jeu

0.42

 verbessern

0.42

POSITIVE LOGITS

𝙉

0.52

ଂ

0.50

颅

0.48

ёт

0.47

iqueness

0.47

𝙀

0.46

requencies

0.43

 চেয়ারম্যান

0.43

itness

0.42

icolored

0.42

Activations Density 0.012%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact