Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

code and symbols

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-llama-3.1-8b-instruct/resid_post_layer_7/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.7.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

uters

-0.07

_cust

-0.07

継

-0.07

 /*#__

-0.06

/story

-0.06

之间

-0.06

anghai

-0.06

[,]

-0.06

提

-0.06

_workspace

-0.06

POSITIVE LOGITS

arrow

0.07

ектив

0.06

 dropped

0.06

 treatment

0.06

 protr

0.06

(layer

0.06

.Text

0.06

 questo

0.06

Dun

0.06

Treatment

0.06

Activations Density 1.820%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact