Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

plastic key

np_acts-logits-general · gemini-2.5-flash-lite

New Auto-Interp

Configuration

google/gemma-scope-2-4b-it/resid_post/layer_17_width_65k_l0_medium

Prompts (Dashboard)

238,145 prompts, 512 tokens each

Dataset (Dashboard)

lmsys + oasst1

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 weiteren

1.20

%、

1.14

inescence

1.07

tt

1.07

ม

1.06

১২

1.05

 entstanden

1.04

ारे

1.04

 начинается

1.02

 αρχ

1.02

POSITIVE LOGITS

ो

1.36

 equival

1.22

quele

1.15

que

1.14

ছু

1.13

ра

1.09

 уча

1.08

Ricardo

1.07

ри

1.07

ЛЕ

1.05

Activations Density 0.001%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact