INDEX

Explanations

ospace

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-qwen2.5-7b-instruct/resid_post_layer_11/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.11.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

([[

-0.07

怃

-0.07

 incompetence

-0.07

 harassed

-0.07

 punitive

-0.07

การออกแบบ

-0.07

わない

-0.07

 dioxide

-0.07

 vess

-0.06

协会会长

-0.06

POSITIVE LOGITS

连云港

0.07

 ?>"><

0.07

 Islands

0.07

.Payload

0.07

 Electric

0.06

thrown

0.06

空中

0.06

 reveals

0.06

 leftovers

0.06

 prescribed

0.06

Activations Density 0.001%

ospace

No Comments

No Known Activations

ospace

No Comments

No Known Activations