INDEX

Explanations

Media announcements and releases

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-llama-3.1-8b-instruct/resid_post_layer_15/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.15.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

Pane

-0.08

 heaven

-0.06

meteor

-0.06

 Corporate

-0.06

 Belmont

-0.06

Lewis

-0.06

 onze

-0.06

Monad

-0.06

 Dunk

-0.06

flow

-0.06

POSITIVE LOGITS

 ชนะ

0.06

 ostr

0.06

 Spiel

0.06

neau

0.06

'".

0.06

 motions

0.06

 kış

0.06

魔法

0.06

maid

0.06

Activations Density 0.017%

Media announcements and releases

No Comments

No Known Activations

Media announcements and releases

No Comments

No Known Activations