INDEX

Explanations

family-related words and phrases

oai_token-act-pair · gpt-3.5-turbo Triggered by @bot

New Auto-Interp

Configuration

jbloom/Gemma-2b-IT-Residual-Stream-SAEs/gemma_2b_it_blocks.12.hook_resid_post_16384

Prompts (Dashboard)

24,576 prompts, 128 tokens each

Dataset (Dashboard)

HuggingFaceFW/fineweb

Features

16,384

Data Type

float32

Hook Name

blocks.12.hook_resid_post

Hook Layer

Architecture

standard

Context Size

1,024

Dataset

Skylion007/openwebtext

Activation Function

relu

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

idr

-1.06

 reluct

-1.04

 „,

-1.04

 maneu

-1.04

 kask

-1.02

 gmbh

-1.00

 effe

-0.99

mef

-0.97

 wien

-0.97

 socie

-0.97

POSITIVE LOGITS

 killed

0.57

 attending

0.54

 registered

0.52

 enrolled

0.52

 involved

0.51

 abroad

0.50

who

0.49

 whom

0.49

 deceased

0.48

 тоже

0.47

Activations Density 0.362%

family-related words and phrases

No Comments

No Known Activations

family-related words and phrases

No Comments

No Known Activations