INDEX

Explanations

Not displaying correctly

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-llama-3.1-8b-instruct/resid_post_layer_7/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.7.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 resistant

-0.07

thon

-0.07

 instructors

-0.06

	Token

-0.06

tips

-0.06

介

-0.06

.subscribe

-0.06

masında

-0.06

.done

-0.06

expected

-0.06

POSITIVE LOGITS

agher

0.06

loys

0.06

eax

0.06

 charitable

0.06

<Model

0.06

:.

0.06

 minds

0.06

 persec

0.06

Canadian

0.06

 revised

0.06

Activations Density 0.067%

Not displaying correctly

No Comments

No Known Activations

Not displaying correctly

No Comments

No Known Activations