Neuronpedia

APIAssistant AxisNEW Circuit TracerNEW Steer SAE Evals Exports Community Blog Privacy & Terms Contact

INDEX

Explanations

Japan, Japanese, ume, Memory Lane

np_acts-logits-general · gemini-2.5-flash-lite

New Auto-Interp

Configuration

google/gemma-scope-2-27b-it/resid_post/layer_40_width_262k_l0_medium

Prompts (Dashboard)

238,145 prompts, 512 tokens each

Dataset (Dashboard)

lmsys + oasst1

Embeds

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

鶘

0.83

鎊

0.79

颶

0.77

猞

0.74

瘓

0.71

騾

0.71

劊

0.69

妫

0.69

虢

0.68

🌯

0.68

POSITIVE LOGITS

 Japanese

2.75

 Japan

2.69

 일본

2.53

Japanese

2.44

 япон

2.42

Japan

2.39

 japan

2.34

 Tokyo

2.27

 Jepang

2.23

 japanese

2.22

Activations Density 0.234%

No Known Activations

© Neuronpedia 2025

Privacy & Terms Blog GitHub Slack Twitter Contact