Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

birds

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-gpt-oss-20b/resid_post_layer_11/trainer_0

Dataset (Dashboard)

Various

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

tero

-0.07

#from

-0.07

ayson

-0.07

ç

-0.07

nested

-0.07

setzung

-0.07

uring

-0.07

 blast

-0.06

 delet

-0.06

 forne

-0.06

POSITIVE LOGITS

 tonight

0.14

夜

0.14

 noct

0.13

 രാത്രി

0.13

 രാത്ര

0.13

 ರಾತ್ರಿ

0.13

夜

0.12

晚

0.12

 রাত

0.12

 ಸಂಜೆ

0.12

Activations Density 0.080%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact