INDEX

Explanations

Obama

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-llama-3.1-8b-instruct/resid_post_layer_7/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.7.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 pencil

-0.07

の

-0.06

ptive

-0.06

іту

-0.06

gia

-0.06

 проте

-0.06

+-

-0.06

_ball

-0.06

unc

-0.05

他的

-0.05

POSITIVE LOGITS

 destinationViewController

0.08

stackoverflow

0.07

.Fail

0.07

 평당

0.07

 sommes

0.07

}{$

0.07

 MainActivity

0.06

Configs

0.06

 Serena

0.06

 didSelectRowAtIndexPath

0.06

Activations Density 0.014%

Obama

No Comments

No Known Activations

Obama

No Comments

No Known Activations