INDEX

Explanations

asterisk

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-llama-3.1-8b-instruct/resid_post_layer_19/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.19.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

.');
↵

-0.07

 exhib

-0.07

 }];↵↵

-0.07

Moder

-0.07

Entre

-0.06

캐

-0.06

sampling

-0.06

 meteor

-0.06

 burn

-0.06

.camera

-0.06

POSITIVE LOGITS

"in

0.07

 зак

0.07

 ################################################################

0.07

_REPLY

0.06

 consecutive

0.06

ADIO

0.06

odafone

0.06

_win

0.06

 Zend

0.06

adder

0.06

Activations Density 0.001%

asterisk

No Comments

No Known Activations