INDEX

Explanations

place/finish in competition

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-llama-3.1-8b-instruct/resid_post_layer_11/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.11.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 tested

-0.07

 wired

-0.07

 purchases

-0.07

 cave

-0.06

olved

-0.06

 banda

-0.06

lbrace

-0.06

 encompasses

-0.06

ダ

-0.06

 Raised

-0.06

POSITIVE LOGITS

لية

0.07

inidad

0.07

 عليها

0.07

thood

0.07

 submarines

0.07

.isActive

0.07

(md

0.07

 autob

0.07

ิน

0.06

homme

0.06

Activations Density 0.018%

place/finish in competition

No Comments

No Known Activations

place/finish in competition

No Comments

No Known Activations