INDEX

Explanations

query

np_max-act-logits · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-qwen2.5-7b-instruct/resid_post_layer_19/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.19.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

.ArgumentParser

-0.07

_CSV

-0.07

 trainable

-0.07

Flags

-0.07

Sdk

-0.07

 inputStream

-0.07

/socket

-0.07

.SharedPreferences

-0.07

aq

-0.07

Reviews

-0.07

POSITIVE LOGITS

 transit

0.08

号码

0.08

 durante

0.07

amping

0.07

cú

0.07

nesc

0.07

arat

0.07

 withd

0.07

 rallying

0.07

رص

0.06

Activations Density 0.032%

query

No Comments

No Known Activations

query

No Comments

No Known Activations