INDEX

Explanations

No Explanations Found

New Auto-Interp

Configuration

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.19.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 końca

-0.08

取证

-0.07

 đoán

-0.07

廠商

-0.07

 manpower

-0.07

 shortest

-0.07

ארבע

-0.07

 Diameter

-0.06

뮹

-0.06

 brunch

-0.06

POSITIVE LOGITS

.titleLabel

0.07

 Patrol

0.07

.meta

0.07

ѓ

0.06

(IL

0.06

 بعد

0.06

 Rohing

0.06

кат

0.06

 Appears

0.06

Activations Density 0.009%

No Known Activations