Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

div

np_max-act-logits · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-qwen2.5-7b-instruct/resid_post_layer_19/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.19.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 thesis

-0.08

 Sorted

-0.08

 Dustin

-0.07

PFN

-0.07

锘

-0.07

由於

-0.07

日报记者

-0.07

 forums

-0.07

urg

-0.07

pik

-0.06

POSITIVE LOGITS

 المل

0.08

 illustrations

0.08

-contact

0.08

哺乳

0.07

UEL

0.07

牺牲

0.07

传染病

0.07

כשיו

0.07

最快的

0.07

 ride

0.07

Activations Density 0.005%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact