Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

action

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

mwhanna/qwen3-4b-transcoders/layer_9.safetensors

Prompts (Dashboard)

16,384 prompts, 128 tokens each

Dataset (Dashboard)

monology/pile-uncopyrighted

Features

163,840

Data Type

float32

Hook Name

blocks.9.mlp.hook_in

Architecture

transcoder

Context Size

8,192

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

nf

-0.30

inet

-0.28

æķ£

-0.28

 TMPro

-0.25

renal

-0.25

jem

-0.25

{:

-0.24

 ÄĳáºŃu

-0.24

çľĭä½ł

-0.24

Ð°Ð¹Ð½

-0.24

POSITIVE LOGITS

cou

0.27

æĮĳ

0.26

 cord

0.25

Bib

0.25

æľ¬

0.25

gÃ¼

0.24

stead

0.24

è³ŀ

0.24

,w

0.23

::_

0.23

Activations Density 0.067%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact