INDEX
Explanations
japanese and korean verb endings
New Auto-Interp
Negative Logits
だと思います
0.81
如果您
0.77
してみてください
0.76
잖아요
0.75
นะครับ
0.75
ですよ
0.74
ですよね
0.73
겠죠
0.73
거예요
0.73
ってます
0.73
POSITIVE LOGITS
있으며
0.84
だが
0.80
しており
0.76
으며
0.73
이다
0.67
이며
0.67
했으며
0.66
하며
0.64
보인다
0.64
であり
0.64
Activations Density 0.002%