Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

it

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-llama-3.1-8b-instruct/resid_post_layer_15/trainer_1

Dataset (Dashboard)

Various

Features

131,072

Data Type

float32

Hook Name

blocks.15.hook_resid_post

Architecture

standard

Context Size

1,024

Dataset

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

antes

-0.07

 gratuita

-0.06

UIT

-0.06

kö

-0.06

ılığı

-0.06

ลาด

-0.06

üc

-0.06

uit

-0.06

jaw

-0.06

.have

-0.06

POSITIVE LOGITS

 ㅇㅇ

0.07

独

0.07

pet

0.06

만

0.06

 validators

0.06

 microphone

0.06

	category

0.06

 foreclosure

0.06

 spawning

0.06

(DIR

0.06

Activations Density 0.000%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact