Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

acrobatic maneuvers and feats

np_acts-logits-general · gemini-2.5-flash-lite

New Auto-Interp

Configuration

google/gemma-scope-2-27b-it/resid_post/layer_16_width_262k_l0_medium

Prompts (Dashboard)

238,145 prompts, 512 tokens each

Dataset (Dashboard)

lmsys + oasst1

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

1.02

ام

0.99

0.98

The

0.97

ل

0.96

ক

0.88

0.88

In

0.87

ח

0.87

It

0.85

POSITIVE LOGITS

га

0.85

ية

0.77

jų

0.73

 еди

0.68

üte

0.64

ní

0.64

üll

0.64

ıç

0.64

 vielf

0.64

ü

0.64

Activations Density 0.001%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact