Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

`.hs` file extensions

np_acts-logits-general · gemini-2.5-flash-lite

New Auto-Interp

Configuration

google/gemma-scope-2-27b-it/transcoder_all/layer_5_width_262k_l0_small_affine

Prompts (Dashboard)

238,145 prompts, 512 tokens each

Dataset (Dashboard)

lmsys + oasst1

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

tede

1.05

tri

1.04

taus

0.98

th

0.93

ătate

0.93

しさ

0.93

ikuti

0.93

่

0.93

pooling

0.92

ted

0.92

POSITIVE LOGITS

to

1.48

ني

1.42

1.37

be

1.35

ון

1.30

1.25

ל

1.24

بي

1.21

 fünf

1.10

 arbeit

1.09

Activations Density 0.000%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact