INDEX

Explanations

one or two

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-llama-3.1-8b-instruct/resid_post_layer_11/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.11.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

ฒ

-0.08

baru

-0.07

ды

-0.07

 AssemblyTrademark

-0.07

 Verb

-0.07

TriState

-0.07

 geçmiş

-0.06

리어

-0.06

 ViewState

-0.06

Always

-0.06

POSITIVE LOGITS

خوان

0.07

报名

0.06

separator

0.06

анка

0.06

.zone

0.06

	record

0.06

 depiction

0.06

=./

0.06

Natural

0.06

////////////////////////////////////////////////////////////////////////////////

0.06

Activations Density 0.003%

one or two

No Comments

No Known Activations