INDEX
Negative Logits
the
1.10
\
1.05
t
1.03
présente
0.99
ä
0.98
c
0.94
ik
0.87
the
0.82
to
0.82
ien
0.82
POSITIVE LOGITS
ن
1.45
ন
1.40
ン
1.36
ன்
1.20
น
1.20
н
1.18
न
1.13
з
1.09
મ
1.07
것
1.06
Activations Density 0.004%
the
\
t
présente
ä
c
ik
the
to
ien
ن
ন
ン
ன்
น
н
न
з
મ
것