INDEX

Explanations

against

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-llama-3.1-8b-instruct/resid_post_layer_15/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.15.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

.Chat

-0.07

 producto

-0.07

Obs

-0.07

 surrounding

-0.07

 історії

-0.07

buy

-0.07

thumb

-0.06

.pass

-0.06

٠

-0.06

 cocktail

-0.06

POSITIVE LOGITS

 against

0.12

 Against

0.11

against

0.09

Against

0.08

-important

0.06

 onların

0.06

tering

0.06

allen

0.06

Confirmed

0.06

/／

0.06

Activations Density 0.068%

against

No Comments

No Known Activations