INDEX

Explanations

No Explanations Found

New Auto-Interp

Configuration

andyrdt/saes-qwen2.5-7b-instruct/resid_post_layer_15/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.15.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

فذ

-0.08

 producing

-0.08

Gene

-0.07

 rospy

-0.07

 localStorage

-0.07

})↵↵↵

-0.06

evaluate

-0.06

來說

-0.06

 monkeys

-0.06

惠

-0.06

POSITIVE LOGITS

 Photos

0.07

好几个

0.07

咣

0.07

 renovations

0.07

sid

0.07

Epoch

0.07

.Roles

0.06

 Mixer

0.06

 walls

0.06

�

0.06

Activations Density 0.002%

No Comments

No Known Activations

No Comments

No Known Activations