INDEX

Explanations

Hardware and interrupts

np_max-act-logits · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-llama-3.1-8b-instruct/resid_post_layer_27/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.27.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 ViewData

-0.06

 melted

-0.06

 PRIMARY

-0.06

 Connor

-0.06

Zend

-0.06

(indices

-0.06

 assumed

-0.06

นว

-0.06

ят

-0.06

Align

-0.06

POSITIVE LOGITS

ago

0.08

 toggle

0.06

frau

0.06

 thỏa

0.06

 veri

0.06

 chew

0.06

 unary

0.05

GT

0.05

 बय

0.05

/extensions

0.05

Activations Density 0.038%

Hardware and interrupts

No Comments

No Known Activations