INDEX

Explanations

LaTeX formatting symbols

oai_token-act-pair · gemini-2.0-flash

$

np_max-act-logits · gemini-2.0-flash

New Auto-Interp

Configuration

google/gemma-scope-2b-pt-transcoders/layer_20/width_16k/average_l0_11

Prompts (Dashboard)

24,576 prompts, 128 tokens each

Dataset (Dashboard)

monology/pile-uncopyrighted

Features

16,384

Data Type

float32

Hook Name

blocks.20.ln2.hook_normalized

Architecture

jumprelu_transcoder

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

↵↵

-0.66

su

-0.60

$\

-0.60

-0.58

-0.57

-0.56

top

-0.55

-0.50

ha

-0.49

POSITIVE LOGITS

Efq

0.91

 iſt

0.91

 purpoſe

0.86

 onCancelled

0.85

 Waray

0.85

 Monfieur

0.85

 Shakspeare

0.84

 незавершена

0.84

 MainAxisSize

0.84

 diſt

0.82

Activations Density 1.134%

LaTeX formatting symbols

$

No Comments

No Known Activations

LaTeX formatting symbols

$

No Comments

No Known Activations