Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

Javascript code

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-gpt-oss-20b/resid_post_layer_11/trainer_0

Dataset (Dashboard)

Various

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

튜

-0.08

 tensors

-0.08

 tablet

-0.08

家具

-0.08

 humidity

-0.08

åp

-0.08

Nancy

-0.07

 correlations

-0.07

 планш

-0.07

 hardwood

-0.07

POSITIVE LOGITS

_BINARY

0.08

 назы

0.08

 жетек

0.08

озар

0.07

 рым

0.07

 arbeid

0.07

 called

0.07

 conventional

0.07

rol

0.07

vaient

0.07

Activations Density 0.001%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact