INDEX

Explanations

Research papers (DOI)

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-llama-3.1-8b-instruct/resid_post_layer_15/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.15.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 района

-0.07

-metal

-0.06

 colonies

-0.06

.Cursors

-0.06

 мала

-0.06

ackages

-0.06

 checker

-0.06

곤

-0.06

 Between

-0.06

라고

-0.06

POSITIVE LOGITS

 Pell

0.07

 Martha

0.06

 fired

0.06

 resets

0.06

End

0.06

VOID

0.06

Pel

0.06

 español

0.06

」，

0.06

 disgr

0.06

Activations Density 0.004%

Research papers (DOI)

No Comments

No Known Activations

Research papers (DOI)

No Comments

No Known Activations