INDEX

Explanations

Government/politics

np_max-act-logits · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-llama-3.1-8b-instruct/resid_post_layer_23/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.23.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

Как

-0.07

ึง

-0.07

LEMENT

-0.07

 reading

-0.07

 bean

-0.06

cs

-0.06

 assessment

-0.06

Quit

-0.06

 listening

-0.06

 jsem

-0.06

POSITIVE LOGITS

.Priority

0.06

 entreprene

0.06

MethodManager

0.06

.lucene

0.06

 CancellationToken

0.06

hod

0.06

_Port

0.06

 Apprentice

0.06

iề

0.06

 imposition

0.06

Activations Density 0.051%

Government/politics

No Comments

No Known Activations

Government/politics

No Comments

No Known Activations