INDEX

Explanations

*w

np_max-act-logits · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-llama-3.1-8b-instruct/resid_post_layer_27/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.27.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 draft

-0.07

 seams

-0.07

จะต

-0.06

Money

-0.06

 Singles

-0.06

-pound

-0.06

 capt

-0.06

 numbering

-0.06

 urges

-0.06

 money

-0.06

POSITIVE LOGITS

 آماده

0.07

 هن

0.07

?>><?

0.06

 東京

0.06

 cricket

0.06

.fits

0.06

"↵↵↵↵

0.06

-ng

0.06

olv

0.06

/Data

0.06

Activations Density 0.000%

No Known Activations

This feature has no known activations.