INDEX

Explanations

database/code entries

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-llama-3.1-8b-instruct/resid_post_layer_7/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.7.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

disc

-0.06

inch

-0.06

-clock

-0.06

 중요한

-0.06

 Meadows

-0.06

 seine

-0.06

 niece

-0.05

_article

-0.05

拓

-0.05

.Deep

-0.05

POSITIVE LOGITS

 turnovers

0.07

 Quang

0.07

_EQUALS

0.07

rift

0.07

 murderous

0.06

Sep

0.06

(formData

0.06

Assistant

0.06

OCC

0.06

 Delhi

0.06

Activations Density 0.032%

database/code entries

No Comments

No Known Activations

database/code entries

No Comments

No Known Activations