INDEX

Explanations

};

np_max-act-logits · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-llama-3.1-8b-instruct/resid_post_layer_27/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.27.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

ぶ

-0.07

Encode

-0.07

humidity

-0.07

(Encoding

-0.07

ldb

-0.06

Criteria

-0.06

\Persistence

-0.06

pictures

-0.06

Behavior

-0.06

 enclosed

-0.06

POSITIVE LOGITS

ece

0.06

 переп

0.06

 salario

0.06

ỳ

0.06

 blackColor

0.06

]"↵

0.06

DBG

0.06

 scal

0.06

 Trick

0.06

.Support

0.06

Activations Density 0.004%

};

No Comments

No Known Activations