INDEX

Explanations

Code

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

mwhanna/qwen3-4b-transcoders/layer_23.safetensors

Prompts (Dashboard)

16,384 prompts, 128 tokens each

Dataset (Dashboard)

monology/pile-uncopyrighted

Features

163,840

Data Type

float32

Hook Name

blocks.23.mlp.hook_in

Architecture

transcoder

Context Size

8,192

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

èĢĺ

-0.27

ÃŃm

-0.27

äº®

-0.25

URL

-0.25

éĴĪå¯¹æĢ§

-0.24

ndo

-0.24

bin

-0.24

ç©¿éĢı

-0.24

 both

-0.23

 Both

-0.23

POSITIVE LOGITS

ynos

0.29

stag

0.28

cac

0.27

brane

0.25

apo

0.25

rene

0.25

åįķè½¦

0.25

åľ¨æĪĳåĽ½

0.24

fare

0.24

aise

0.24

Activations Density 0.019%

Code

No Comments

No Known Activations