INDEX

Explanations

No Explanations Found

New Auto-Interp

Configuration

mwhanna/qwen3-4b-transcoders/layer_23.safetensors

Prompts (Dashboard)

16,384 prompts, 128 tokens each

Dataset (Dashboard)

monology/pile-uncopyrighted

Features

163,840

Data Type

float32

Hook Name

blocks.23.mlp.hook_in

Architecture

transcoder

Context Size

8,192

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

usive

-0.28

dden

-0.26

Slo

-0.25

bject

-0.24

agn

-0.24

itat

-0.24

sno

-0.23

æľ¬å¸Ĥ

-0.23

çĥ¦

-0.23

els

-0.23

POSITIVE LOGITS

 accelerated

0.29

gow

0.27

 alone

0.27

æŃ£æĸĩ

0.27

PACE

0.26

å¥½åĲ§

0.26

 afin

0.25

æŃ£å¸¸

0.25

 unleashed

0.25

 advanced

0.25

Activations Density 0.006%

No Known Activations

This feature has no known activations.