INDEX
Negative Logits
s
1.67
ين
1.52
have
1.23
p
1.18
sa
1.10
اني
1.09
v
1.05
。
1.01
the
1.00
o
1.00
POSITIVE LOGITS
ू
1.31
in
1.24
t
1.23
۰
1.20
to
1.16
การ
1.13
も
1.11
در
1.09
आई
1.05
huts
1.03
Activations Density 0.000%
s
ين
have
p
sa
اني
v
。
the
o
ू
in
t
۰
to
การ
も
در
आई
huts