Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

between

np_max-act · gemini-2.0-flash

New Auto-Interp

Configuration

Prompts (Dashboard)

16,384 prompts, 128 tokens each

Dataset (Dashboard)

monology/pile-uncopyrighted

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

 between

-2.02

 BETWEEN

-1.84

 Between

-1.84

Between

-1.83

 mellan

-1.79

between

-1.74

 mellom

-1.71

 mellem

-1.66

 tussen

-1.62

 betwixt

-1.62

POSITIVE LOGITS

the

1.02

0.81

her

0.73

0.73

The

0.69

0.68

his

0.66

0.65

“

0.64

 those

0.63

Activations Density 0.100%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact