INDEX

Explanations

No Explanations Found

New Auto-Interp

Configuration

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.19.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

深深

-0.07

 qualities

-0.07

放射

-0.07

永恒

-0.07

 Charges

-0.07

	Start

-0.07

 Holmes

-0.07

 Yazı

-0.06

ững

-0.06

Defs

-0.06

POSITIVE LOGITS

DM

0.08

STRACT

0.07

.language

0.07

 שיה

0.07

────────

0.06

(master

0.06

#[

0.06

League

0.06

 artikel

0.06

Activations Density 0.007%

No Known Activations