Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

М

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-gpt-oss-20b/resid_post_layer_11/trainer_0

Dataset (Dashboard)

Various

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

Nun

-0.08

 товари

-0.08

bru

-0.07

 товары

-0.07

nections

-0.07

巨大

-0.07

イス

-0.07

phy

-0.07

sept

-0.07

 nylon

-0.07

POSITIVE LOGITS

-program

0.11

programma

0.11

Programme

0.10

 программу

0.10

 programs

0.10

/script

0.10

 programmation

0.10

 프로그램

0.10

 programu

0.09

programm

0.09

Activations Density 0.017%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact