INDEX

Explanations

Stop words

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

mwhanna/qwen3-4b-transcoders/layer_19.safetensors

Prompts (Dashboard)

16,384 prompts, 128 tokens each

Dataset (Dashboard)

monology/pile-uncopyrighted

Features

163,840

Data Type

float32

Hook Name

blocks.19.mlp.hook_in

Architecture

transcoder

Context Size

8,192

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

èĥ½çľĭåĪ°

-0.28

æĳ¸

-0.27

uje

-0.27

 about

-0.26

ç»¼

-0.26

éĢıè§Ĩ

-0.26

äº®

-0.26

 certify

-0.25

éĢļ

-0.25

 confirm

-0.25

POSITIVE LOGITS

eprom

0.28

holders

0.25

æŃ¥ä¼Ĳ

0.24

ãĤĭãĤĪãģĨãģ«

0.23

andin

0.23

ä½¿ä¹ĭ

0.23

ãģĬãĤĬ

0.23

engo

0.23

é¤¨

0.23

PWM

0.23

Activations Density 0.061%

Stop words

No Comments

No Known Activations