INDEX

Explanations

dinner planning

np_max-act-logits · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-llama-3.1-8b-instruct/resid_post_layer_27/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.27.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 chloride

-0.07

ями

-0.07

-[

-0.07

rel

-0.06

您的

-0.06

amientos

-0.06

,p

-0.06

 construed

-0.06

 وك

-0.06

ogne

-0.06

POSITIVE LOGITS

	ULONG

0.06

 Mechanics

0.06

 Counties

0.06

 MotionEvent

0.06

>[↵

0.06

 descricao

0.06

 الصن

0.06

 GLint

0.06

 StatefulWidget

0.06

 teaches

0.06

Activations Density 0.041%

dinner planning

No Comments

No Known Activations