INDEX

Explanations

sequence

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-llama-3.1-8b-instruct/resid_post_layer_11/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.11.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 Friedrich

-0.07

	Copyright

-0.07

')(

-0.07

伯

-0.07

Mrs

-0.06

_ylabel

-0.06

Ted

-0.06

 Turnbull

-0.06

.XtraReports

-0.06

 Marriott

-0.06

POSITIVE LOGITS

 sequence

0.12

 Sequence

0.11

 sequential

0.10

sequence

0.09

 sequences

0.09

 Sequ

0.09

(seq

0.08

_seq

0.08

 sequentially

0.08

Activations Density 0.024%

sequence

No Comments

No Known Activations