INDEX

Explanations

hidden places/information

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-llama-3.1-8b-instruct/resid_post_layer_15/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.15.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

Ạ

-0.06

ř

-0.06

.maximum

-0.06

 ministers

-0.06

сю

-0.06

_compress

-0.06

ouz

-0.06

利

-0.06

.an

-0.06

 vedení

-0.05

POSITIVE LOGITS

 pstmt

0.07

 تص

0.07

 Stripe

0.07

-hooks

0.06

zee

0.06

Creator

0.06

Videos

0.06

 treason

0.06

 Demp

0.06

peng

0.06

Activations Density 0.128%

hidden places/information

No Comments

No Known Activations

hidden places/information

No Comments

No Known Activations