INDEX

Explanations

idine

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-llama-3.1-8b-instruct/resid_post_layer_7/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.7.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

Autor

-0.07

ours

-0.06

";"

-0.06

 Soon

-0.06

dj

-0.06

eating

-0.06

 इस

-0.06

Charts

-0.06

оглас

-0.06

 örgüt

-0.06

POSITIVE LOGITS

ussy

0.07

구

0.07

 professionalism

0.07

 предостав

0.06

 international

0.06

 màn

0.06

 процессе

0.06

 italian

0.06

(access

0.06

 hallway

0.06

Activations Density 0.004%

idine

No Comments

No Known Activations

idine

No Comments

No Known Activations