INDEX

Explanations

Online account management

np_max-act-logits · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-qwen2.5-7b-instruct/resid_post_layer_19/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.19.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

MLE

-0.07

	append

-0.07

 morally

-0.07

 coder

-0.07

 defaultMessage

-0.07

XHR

-0.07

_spaces

-0.07

_MEDIUM

-0.07

 stddev

-0.06

LineWidth

-0.06

POSITIVE LOGITS

𝖌

0.07

 אח

0.07

 title

0.07

_hub

0.06

�

0.06

潞

0.06

 availability

0.06

Base

0.06

炬

0.06

溹

0.06

Activations Density 0.147%

Online account management

No Comments

No Known Activations

Online account management

No Comments

No Known Activations