Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

lens

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-gpt-oss-20b/resid_post_layer_11/trainer_0

Dataset (Dashboard)

Various

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 Sometimes

-0.08

.floor

-0.08

 मध्य

-0.08

ديق

-0.08

 Occasionally

-0.08

 ejerc

-0.08

 wächst

-0.08

 सामाजिक

-0.08

icked

-0.08

(stock

-0.08

POSITIVE LOGITS

 fors

0.08

 Geneva

0.07

 forts

0.07

 Davies

0.07

 പര

0.07

jav

0.07

 сообщ

0.07

bones

0.07

 Panama

0.07

ihana

0.07

Activations Density 0.001%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact