INDEX

Explanations

words and phrases related to ongoing conflict or disagreement

oai_token-act-pair · gemini-2.0-flash

punctuation marks indicating questions or dialogue

np_token-act-pair-logits · gpt-4o-mini

Quotation punctuation

np_max-act-logits · gemini-2.0-flash

say "punctuation" Method used: 2 — reason: tokens after are mainly punctuation/commas/periods — explanation: say "punctuation"

np_max-act-logits · gpt-5-mini Triggered by @chenshw0109

New Auto-Interp

Configuration

google/gemma-scope-2b-pt-transcoders/layer_21/width_16k/average_l0_13

Prompts (Dashboard)

24,576 prompts, 128 tokens each

Dataset (Dashboard)

monology/pile-uncopyrighted

Features

16,384

Data Type

float32

Hook Name

blocks.21.ln2.hook_normalized

Architecture

jumprelu_transcoder

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

GroupLayout

-0.64

 tartalomajánló

-0.58

 createState

-0.57

artiges

-0.52

UDAD

-0.50

WarningLevel

-0.50

IFICA

-0.49

Skocz

-0.48

ANDUM

-0.47

tagens

-0.47

POSITIVE LOGITS

?”

1.06

.”

0.95

),”

0.93

.”)

0.92

 ?”

0.90

,”

0.90

0.87

.”—

0.85

,’”

0.84

?’

0.83

Activations Density 21.411%

words and phrases related to ongoing conflict or disagreement

punctuation marks indicating questions or dialogue

Quotation punctuation

say "punctuation" Method used: 2 — reason: tokens after are mainly punctuation/commas/periods — explanation: say "punctuation"

No Comments

No Known Activations

words and phrases related to ongoing conflict or disagreement

punctuation marks indicating questions or dialogue

Quotation punctuation

say "punctuation" Method used: 2 — reason: tokens after are mainly punctuation/commas/periods — explanation: say "punctuation"

No Comments

No Known Activations