INDEX

Explanations

electronic signatures

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-qwen2.5-7b-instruct/resid_post_layer_11/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.11.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

enaire

-0.08

 egregious

-0.07

 andere

-0.07

	password

-0.07

-info

-0.07

זיכרון

-0.07

 traverse

-0.07

Ray

-0.07

-east

-0.07

 voksne

-0.07

POSITIVE LOGITS

≴

0.07

🥉

0.07

拙

0.07

⁅

0.07

噙

0.07

微妙

0.07

🌬

0.07

ubuntu

0.06

轮

0.06

╦

0.06

Activations Density 0.019%

electronic signatures

No Comments

No Known Activations

electronic signatures

No Comments

No Known Activations