INDEX

Explanations

measures

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-llama-3.1-8b-instruct/resid_post_layer_3/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.3.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 відповідаль

-0.07

_uv

-0.06

 maint

-0.06

 +**************

-0.06

 Siri

-0.06

สะดวก

-0.06

 nameof

-0.06

술

-0.06

 openly

-0.06

 관한

-0.06

POSITIVE LOGITS

 measures

0.11

attles

0.07

 legal

0.07

اب

0.07

analysis

0.07

''↵

0.07

valuation

0.06

 critique

0.06

{{

0.06

 Measures

0.06

Activations Density 0.015%

measures

No Comments

No Known Activations