INDEX
Negative Logits
라
0.90
생
0.80
𝟎
0.79
𝟘
0.79
0
0.76
有所
0.75
ला
0.70
도를
0.70
보
0.69
рить
0.68
POSITIVE LOGITS
ing
1.23
ING
1.19
ION
0.96
can
0.90
ة
0.88
ian
0.88
ER
0.86
or
0.86
_
0.85
en
0.80
Activations Density 0.002%
라
생
𝟎
𝟘
0
有所
ला
도를
보
рить
ing
ING
ION
can
ة
ian
ER
or
_
en