INDEX

Explanations

expressing thoughts/opinions

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-llama-3.1-8b-instruct/resid_post_layer_19/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.19.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

所属

-0.07

 керів

-0.06

 вод

-0.06

ViewById

-0.06

 Evening

-0.06

 Muslims

-0.06

 Critics

-0.06

Yah

-0.06

@admin

-0.06

 внутріш

-0.06

POSITIVE LOGITS

eea

0.07

’i

0.07

liche

0.07

licher

0.06

 gold

0.06

als

0.06

>`;↵

0.06

_THEME

0.06

 bone

0.06

.fac

0.06

Activations Density 0.004%

expressing thoughts/opinions

No Comments

No Known Activations

expressing thoughts/opinions

No Comments

No Known Activations