INDEX

Explanations

punctuations and symbols used for formatting or separating items in a list

oai_token-act-pair · gpt-4o-mini

New Auto-Interp

Configuration

chanind/gemma-2-2b-batch-topk-matryoshka-saes-w-32k-l0-40/standard/blocks.12.hook_resid_post

Prompts (Dashboard)

24,576 prompts, 128 tokens each

Dataset (Dashboard)

monology/pile-uncopyrighted

Features

32,768

Data Type

float32

Hook Name

blocks.12.hook_resid_post

Architecture

jumprelu

Context Size

1,024

Dataset

chanind/pile-uncopyrighted-gemma-1024-abbrv-1B

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

logen

-0.60



-0.52

 hoarse

-0.48

 anges

-0.47

 Anon

-0.47

Ngb

-0.47

yargs

-0.47

 onResponse

-0.46

kuuta

-0.46

 Poseidon

-0.45

POSITIVE LOGITS

 defaultstate

0.63

corrência

0.60

giveness

0.59

 StatelessWidget

0.57

phans

0.57

findpost

0.57

Controllo

0.57

Vidite

0.56

CreateModel

0.56

enterOuterAlt

0.56

Activations Density 0.190%

punctuations and symbols used for formatting or separating items in a list

No Comments

No Known Activations