Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

marketing and business

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-gpt-oss-20b/resid_post_layer_11/trainer_0

Dataset (Dashboard)

Various

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 eerder

-0.09

 pylint

-0.09

pytest

-0.09

 təş

-0.08

kwargs

-0.08

ssid

-0.08

ண்ப

-0.08

 positieve

-0.08

 positief

-0.08

टना

-0.08

POSITIVE LOGITS

揭秘

0.10

 descubrir

0.09

 discovering

0.09

 discovers

0.08

 Secrets

0.08

 discover

0.08

 descobrir

0.08

 الأسر

0.08

 reveals

0.08

 أسر

0.08

Activations Density 0.264%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact