© Neuronpedia 2026

Privacy & Terms Blog GitHub Slack Twitter Contact

Neuronpedia

Jacobian LensNEW

Natural Language

NEW Assistant AxisNEW Circuit TracerUPDATESteer SAE Evals ExportsAPI Community Blog Privacy & Terms Contact

Home
Qwen3-1.7B
27-LLAMASCOPE-2-LORSA-16K-K64
15541

INDEX

Explanations

say Paul

unknown · unknown

New Auto-Interp

Top Features by Cosine Similarity

Embeds

Show PlotsShow ExplanationShow ActivationsShow Test FieldShow SteerShow Link

IFrame

Link

Not in Any Lists

No Comments

Negative Logits

vz

-18.50

rz

-17.38

 Uber

-16.88

ritz

-16.63

warz

-16.25

獐

-15.88

zar

-15.75

rxjs

-15.75

uzu

-15.75

shaw

-15.50

POSITIVE LOGITS

pol

23.63

保罗

22.75

pol

22.50

_pol

21.63

Pol

20.50

 Paul

20.00

opol

20.00

Pol

19.50

Paul

19.13

 polynomial

18.50

Activations Density 0.211%

No Known Activations