INDEX

Explanations

duration

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-llama-3.1-8b-instruct/resid_post_layer_19/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.19.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 Nice

-0.07

fish

-0.07

trap

-0.07

Machine

-0.06

خت

-0.06

Left

-0.06

 enqueue

-0.06

 Lights

-0.06

 kuvvet

-0.06

Ch

-0.06

POSITIVE LOGITS

 durations

0.08

 duration

0.08

Duration

0.08

:maj

0.07

 Duration

0.07

.InnerException

0.07

undai

0.07

conds

0.07

 Dunn

0.07

การพ

0.07

Activations Density 0.011%

duration

No Comments

No Known Activations

duration

No Comments

No Known Activations