INDEX

Explanations

No Explanations Found

New Auto-Interp

Configuration

mwhanna/qwen3-4b-transcoders/layer_23.safetensors

Prompts (Dashboard)

16,384 prompts, 128 tokens each

Dataset (Dashboard)

monology/pile-uncopyrighted

Features

163,840

Data Type

float32

Hook Name

blocks.23.mlp.hook_in

Architecture

transcoder

Context Size

8,192

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 wÅĤ

-0.31

enced

-0.28

å¤§åĽ½

-0.26

ãĤ²

-0.26

æ§Ĭ

-0.25

lix

-0.24

])-

-0.24

bsub

-0.23

Gew

-0.23

ç¥

-0.23

POSITIVE LOGITS

esper

0.35

pa

0.27

0.26

æĭĽ

0.26

att

0.25

è¯®

0.25

olan

0.25

ap

0.25

èĲĿåįľ

0.24

Activations Density 0.149%

No Known Activations

This feature has no known activations.