INDEX

Explanations

pharmac

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-llama-3.1-8b-instruct/resid_post_layer_7/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.7.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 tonumber

-0.07

 søger

-0.07

 départ

-0.07

 روم

-0.06

 naš

-0.06

:::::

-0.06

 BYTE

-0.06

 dlouhodob

-0.06

antidad

-0.06

 dohod

-0.06

POSITIVE LOGITS

 musical

0.07

 intellectually

0.07

edium

0.06

 фіз

0.06

UTC

0.06

 favorite

0.06

 hearing

0.06

broken

0.06

apeut

0.06

 інш

0.06

Activations Density 0.016%

pharmac

No Comments

No Known Activations