Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

left or right bank

np_acts-logits-general · gemini-2.5-flash-lite

New Auto-Interp

Configuration

google/gemma-scope-27b-pt-res/layer_34/width_131k

Prompts (Dashboard)

24,576 prompts, 128 tokens each

Dataset (Dashboard)

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

깬

-0.81

Partici

-0.77

 gedachten

-0.76

Passcode

-0.74

gangss

-0.73

signUp

-0.73

illingham

-0.71

⇉

-0.70

 italienischen

-0.70

dienste

-0.69

POSITIVE LOGITS

 left

4.59

Left

3.77

 Left

3.70

左

3.44

left

3.33

LEFT

2.91

 LEFT

2.83

 right

2.69

左

2.58

右

2.50

Activations Density 0.055%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact