INDEX

Explanations

No Explanations Found

New Auto-Interp

Configuration

andyrdt/saes-qwen2.5-7b-instruct/resid_post_layer_19/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.19.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

椆

-0.07

omidou

-0.07

יכה

-0.07

 aliens

-0.07

.getOwnProperty

-0.07

ienne

-0.07

itoris

-0.07

㴔

-0.07

 caric

-0.07

liches

-0.07

POSITIVE LOGITS

 amazon

0.08

𝕞

0.07

provider

0.07

stress

0.07

效益

0.06

モデル

0.06

 initiative

0.06

غياب

0.06

替

0.06

 وعن

0.06

Activations Density 0.057%

No Comments

No Known Activations