INDEX

Explanations

do

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-llama-3.1-8b-instruct/resid_post_layer_15/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.15.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 RAID

-0.07

 sağlık

-0.07

 Ihnen

-0.07

-themed

-0.06

 cabin

-0.06

 parenting

-0.06

 Genius

-0.06

Prince

-0.06

ふ

-0.06

auge

-0.06

POSITIVE LOGITS

 pravděpodob

0.07

 @{↵

0.07

Attempt

0.06

 ];
↵

0.06

relude

0.06

encoding

0.06

++++++++

0.06

Begin

0.06

{(

0.06

unsqueeze

0.06

Activations Density 0.011%

do

No Comments

No Known Activations