INDEX

Explanations

piano

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-llama-3.1-8b-instruct/resid_post_layer_7/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.7.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

athlete

-0.06

_utilities

-0.06

pek

-0.06

evil

-0.06

 Mostly

-0.06

ekil

-0.06

licts

-0.05

remark

-0.05

quette

-0.05

 molec

-0.05

POSITIVE LOGITS

 Piano

0.16

 piano

0.16

 pian

0.13

Eig

0.08

IsUnicode

0.07

iano

0.07

né

0.07

pio

0.07

.nativeElement

0.07

\application

0.07

Activations Density 0.002%

piano

No Comments

No Known Activations

piano

No Comments

No Known Activations