INDEX

Explanations

Formal written communication

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-qwen2.5-7b-instruct/resid_post_layer_11/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.11.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 mieć

-0.07

进货

-0.07

ilenames

-0.06

 competent

-0.06

lesi

-0.06

חוסר

-0.06

 travelling

-0.06

Ras

-0.06

 earthquake

-0.06

 أح

-0.06

POSITIVE LOGITS

集團

0.07

开通

0.07

社会化

0.07

率为

0.07

推广应用

0.07

 année

0.07

.Publish

0.07

奇瑞

0.07

	build

0.07

_collections

0.06

Activations Density 0.165%

Formal written communication

No Comments

No Known Activations

Formal written communication

No Comments

No Known Activations