INDEX

Explanations

Python programming attributes/calls

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-qwen2.5-7b-instruct/resid_post_layer_11/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.11.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 determining

-0.07

Cah

-0.07

ן

-0.07

ียว

-0.07

 Hawaiian

-0.07

 Mayor

-0.07

Neither

-0.06

/desktop

-0.06

 Represents

-0.06

sst

-0.06

POSITIVE LOGITS

USH

0.06

Nic

0.06

.catch

0.06

コスト

0.06

_ING

0.06

 DEFIN

0.06

曼城

0.06

основ

0.06

тал

0.06

rid

0.06

Activations Density 0.003%

Python programming attributes/calls

No Comments

No Known Activations

Python programming attributes/calls

No Comments

No Known Activations