INDEX

Explanations

No Explanations Found

New Auto-Interp

Configuration

mwhanna/qwen3-4b-transcoders/layer_23.safetensors

Prompts (Dashboard)

16,384 prompts, 128 tokens each

Dataset (Dashboard)

monology/pile-uncopyrighted

Features

163,840

Data Type

float32

Hook Name

blocks.23.mlp.hook_in

Architecture

transcoder

Context Size

8,192

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 controller

-0.29

 controllers

-0.28

 merits

-0.28

controller

-0.27

å¤ªå¿«

-0.27

ãģĭãģĳ

-0.26

	controller

-0.25

 Controller

-0.25

 benefits

-0.25

èĵ¬åĭĥ

-0.24

POSITIVE LOGITS

aten

0.32

ä¹Ŀå¹´

0.28

zem

0.26

estone

0.26

æ¦ľ

0.25

entes

0.25

å¢Ł

0.25

è¾Ł

0.25

letes

0.24

æıĲæ¬¾

0.24

Activations Density 0.003%

No Known Activations

This feature has no known activations.