INDEX

Explanations

sacrifice

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-llama-3.1-8b-instruct/resid_post_layer_15/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.15.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

.network

-0.08

 whistle

-0.08

page

-0.07

Positive

-0.07

 enable

-0.07

 enjoyable

-0.07

 enabled

-0.07

 station

-0.07

 designers

-0.07

 traction

-0.07

POSITIVE LOGITS

 sacrifice

0.12

 sacrifices

0.11

 sacrificed

0.09

 Sacr

0.08

 sacrificing

0.08

 Mort

0.07

 sacr

0.07

Cut

0.07

]--;↵

0.07

 тому

0.07

Activations Density 0.006%

sacrifice

No Comments

No Known Activations