INDEX

Explanations

biological signaling pathways

np_max-act-logits · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-qwen2.5-7b-instruct/resid_post_layer_19/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.19.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 senator

-0.08

Э

-0.07

akh

-0.07

 impunity

-0.06

琼

-0.06

_PKG

-0.06

高级

-0.06

相同的

-0.06

}-{

-0.06

 cultivated

-0.06

POSITIVE LOGITS

BRA

0.07

ylan

0.07

 disfr

0.07

.Controls

0.07

ご利用

0.07

(strlen

0.06

我爱你

0.06

っております

0.06

getline

0.06

vens

0.06

Activations Density 0.045%

biological signaling pathways

No Comments

No Known Activations

biological signaling pathways

No Comments

No Known Activations