INDEX

Explanations

No Explanations Found

New Auto-Interp

Configuration

mwhanna/qwen3-4b-transcoders/layer_23.safetensors

Prompts (Dashboard)

16,384 prompts, 128 tokens each

Dataset (Dashboard)

monology/pile-uncopyrighted

Features

163,840

Data Type

float32

Hook Name

blocks.23.mlp.hook_in

Architecture

transcoder

Context Size

8,192

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

ç«ĭ

-0.31

æĶ¶

-0.30

tro

-0.29

åı«

-0.29

TCHA

-0.27

tin

-0.25

çŃ¾åĲį

-0.25

é¢Ħ

-0.25

äººä»¬

-0.25

POSITIVE LOGITS

éĽĨåĽ¢æĹĹä¸ĭ

0.30

ä¸Ńè¶ħ

0.28

à¸Ĺà¸Ķ

0.26

rlen

0.25

 scientist

0.25

.selectedIndex

0.25

)(_

0.25

á»įng

0.24

-million

0.24

ãĤ°ãĥ«ãĥ¼ãĥĹ

0.24

Activations Density 0.000%

No Known Activations

This feature has no known activations.