INDEX

Explanations

substitution in equations

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-llama-3.1-8b-instruct/resid_post_layer_7/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.7.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

极

-0.07

cept

-0.06

 Collider

-0.06

 яка

-0.06

.exceptions

-0.06

 Тому

-0.06

 ihren

-0.06

.info

-0.06

 🙂↵↵

-0.06

 thé

-0.06

POSITIVE LOGITS

*=

0.08

Outlet

0.07

 Delegate

0.07

Thumb

0.07

Ü

0.06

ик

0.06

 Advertisement

0.06

 Blind

0.06

男

0.06

 substitute

0.06

Activations Density 0.006%

substitution in equations

No Comments

No Known Activations

substitution in equations

No Comments

No Known Activations