INDEX

Explanations

No Explanations Found

New Auto-Interp

Configuration

mwhanna/qwen3-4b-transcoders/layer_23.safetensors

Prompts (Dashboard)

16,384 prompts, 128 tokens each

Dataset (Dashboard)

monology/pile-uncopyrighted

Features

163,840

Data Type

float32

Hook Name

blocks.23.mlp.hook_in

Architecture

transcoder

Context Size

8,192

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

atoria

-0.29

ered

-0.29

ABCDEFGHI

-0.28

amat

-0.27

 fortified

-0.27

ABCDEFG

-0.26

 squirt

-0.26

 tart

-0.25

ETY

-0.25

ickey

-0.25

POSITIVE LOGITS

ä»Ģä¹Īåĳ¢

0.27

 Launcher

0.27

witter

0.25

åīĲ

0.25

ä¸Ģä¸ªéĹ®é¢ĺ

0.25

lv

0.24

ruc

0.24

å·¡èĪª

0.24

 Gros

0.24

ä¸ĢåĪĢ

0.24

Activations Density 0.005%

No Known Activations

This feature has no known activations.