INDEX

Explanations

preservation

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-llama-3.1-8b-instruct/resid_post_layer_15/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.15.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

Popup

-0.08

 nikdo

-0.07

 bite

-0.07

upt

-0.07

 kicking

-0.07

Id

-0.07

 stupidity

-0.07

 Finder

-0.07

 subtract

-0.06

 dumb

-0.06

POSITIVE LOGITS

 preserved

0.09

 conserv

0.08

 Conserv

0.07

 preserves

0.07

保

0.07

 conservation

0.07

原

0.07

 preservation

0.07

 preserve

0.07

 gift

0.07

Activations Density 0.020%

preservation

No Comments

No Known Activations

preservation

No Comments

No Known Activations