INDEX

Explanations

error

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

mwhanna/qwen3-4b-transcoders/layer_9.safetensors

Prompts (Dashboard)

16,384 prompts, 128 tokens each

Dataset (Dashboard)

monology/pile-uncopyrighted

Features

163,840

Data Type

float32

Hook Name

blocks.9.mlp.hook_in

Architecture

transcoder

Context Size

8,192

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

æıĲç¤º

-0.30

rats

-0.28

ä¿¡åı·

-0.27

è´´

-0.26

Tube

-0.25

éĢļ

-0.25

éĹ®é¢ĺ

-0.25

 signal

-0.25

 Polymer

-0.25

Stencil

-0.25

POSITIVE LOGITS

éĽģ

0.24

çıŃåŃĲæĪĲåĳĺ

0.24

ÑĨÐ¸Ð¿

0.24

ä¹¾

0.24

 Lives

0.24

 Ð¾Ð¿Ñĭ

0.24

 analysed

0.23

 dunk

0.23

 experiment

0.23

(fr

0.23

Activations Density 0.728%

error

No Comments

No Known Activations