Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

description

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

andyrdt/saes-gpt-oss-20b/resid_post_layer_11/trainer_0

Dataset (Dashboard)

Various

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

verwaltung

-0.07

:</

-0.07

官方网站

-0.07

_RO

-0.07

_WR

-0.07

ブル

-0.07

 πισ

-0.07

'à

-0.07

 neighbour

-0.07

 вра

-0.07

POSITIVE LOGITS

 vague

0.10

 subjective

0.09

 describes

0.09

describe

0.08

 beskr

0.08

Описание

0.08

 descriptions

0.08

 gevoelens

0.08

描述

0.08

 నాల

0.08

Activations Density 0.002%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact