INDEX

Explanations

displays

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-llama-3.1-8b-instruct/resid_post_layer_3/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.3.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

oun

-0.08

 partner

-0.07

},

-0.07

	loop

-0.07

.Fetch

-0.07

erva

-0.06

 curtain

-0.06

 teardown

-0.06

 guaranteed

-0.06

 Chicago

-0.06

POSITIVE LOGITS

 displays

0.24

 Displays

0.12

Displays

0.11

Founded

0.07

mainwindow

0.07

_STS

0.06

ंड

0.06

 dread

0.06

"P

0.06

ABCDEFG

0.06

Activations Density 0.006%

displays

No Comments

No Known Activations