INDEX

Explanations

malfunctions and disorders

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-llama-3.1-8b-instruct/resid_post_layer_11/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.11.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 ammo

-0.06

separator

-0.06

 employees

-0.06

better

-0.06

áš

-0.06

 전에

-0.06

 memoria

-0.06

stab

-0.06

 Erotic

-0.06

;↵↵↵↵

-0.06

POSITIVE LOGITS

.Kind

0.07

iating

0.06

egrated

0.06

 buna

0.06

rie

0.06

imated

0.06

(sum

0.06

Monthly

0.06

 نشان

0.06

stile

0.06

Activations Density 0.175%

malfunctions and disorders

No Comments

No Known Activations