INDEX

Explanations

state or quality described

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-llama-3.1-8b-instruct/resid_post_layer_11/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.11.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 Christ

-0.06

ones

-0.06

 glean

-0.06

 skirt

-0.06

рин

-0.06

ertas

-0.06

 metavar

-0.06

/gin

-0.06

Him

-0.06

rah

-0.06

POSITIVE LOGITS

読

0.07

uw

0.06

 випадку

0.06

shift

0.06

٫

0.06

 sposób

0.06

 streamlined

0.06

creator

0.06

_Impl

0.06

 stě

0.06

Activations Density 0.047%

state or quality described

No Comments

No Known Activations