INDEX

Explanations

No Explanations Found

New Auto-Interp

Configuration

mwhanna/qwen3-4b-transcoders/layer_19.safetensors

Prompts (Dashboard)

16,384 prompts, 128 tokens each

Dataset (Dashboard)

monology/pile-uncopyrighted

Features

163,840

Data Type

float32

Hook Name

blocks.19.mlp.hook_in

Architecture

transcoder

Context Size

8,192

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

æģº

-0.28

inium

-0.28

ÑĢÑĥÐº

-0.27

 Houses

-0.24

 Devils

-0.24

prises

-0.24

èĬ¯

-0.24

å¹²è´§

-0.23

achusetts

-0.23

stores

-0.23

POSITIVE LOGITS

 rode

0.27

çŃīåİŁåĽł

0.26

 remember

0.25

çĽ¸ä¼´

0.24

 Ð¾ÑĢÐ³Ð°Ð½Ð¸Ð·Ð¼

0.24

è¿Ļåĩłä¸ª

0.24

atoire

0.24

oly

0.24

æĳĨ

0.24

yleft

0.23

Activations Density 0.003%

No Known Activations

This feature has no known activations.