© Neuronpedia 2026

Privacy & Terms Blog GitHub Slack Twitter Contact

Neuronpedia

Jacobian LensNEW

Natural Language

NEW Assistant AxisNEW Circuit TracerUPDATESteer SAE Evals ExportsAPI Community Blog Privacy & Terms Contact

Home
Qwen3-1.7B
27-LLAMASCOPE-2-LORSA-16K-K64
15504

INDEX

Explanations

say "repression"

unknown · unknown

New Auto-Interp

Top Features by Cosine Similarity

Embeds

Show PlotsShow ExplanationShow ActivationsShow Test FieldShow SteerShow Link

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

-fly

-18.25

金币

-16.50

交易平台

-16.25

Fly

-16.13

惫

-16.00

虚空

-15.88

 millionaire

-15.88

 Chevy

-15.69

umper

-15.63

为空

-15.56

POSITIVE LOGITS

 suppression

19.50

 suppress

19.25

 crackdown

18.25

 purge

18.13

 censor

18.00

打压

18.00

镇

17.75

压制

17.38

 repression

17.25

 censorship

17.00

Activations Density 0.377%

No Known Activations