INDEX

Explanations

Being pursued

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-llama-3.1-8b-instruct/resid_post_layer_7/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.7.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 mixes

-0.07

(resources

-0.07

 imperson

-0.07

 iterator

-0.07

 frozen

-0.06

.fac

-0.06

 přih

-0.06

 expenses

-0.06

，与

-0.06

 PointF

-0.06

POSITIVE LOGITS

 ${↵

0.06

orous

0.06

 trailing

0.06

kening

0.06

Word

0.06

罪

0.06

 TInt

0.06

 considered

0.06

.extent

0.06

 Productions

0.06

Activations Density 0.023%

Being pursued

No Comments

No Known Activations

Being pursued

No Comments

No Known Activations