Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

No Explanations Found

New Auto-Interp

Configuration

andyrdt/saes-qwen2.5-7b-instruct/resid_post_layer_23/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.23.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

Calcul

-0.07

-equ

-0.07

 adapting

-0.07

zou

-0.07

.dp

-0.07

健康管理

-0.07

北斗

-0.07

_SCORE

-0.07

/high

-0.07

 Magnus

-0.06

POSITIVE LOGITS

 onPressed

0.07

 inflatable

0.07

铥

0.07

通话

0.07

经开

0.07

未经

0.07

홈

0.06

uras

0.06

ousedown

0.06

廣

0.06

Activations Density 0.075%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact