INDEX
Negative Logits
c
1.23
the
1.05
to
1.03
o
0.94
z
0.91
cence
0.89
по
0.88
و
0.86
b
0.86
se
0.86
POSITIVE LOGITS
ﺔ
0.86
然而
0.84
Međutim
0.82
تاہم
0.78
Использу
0.78
那麼
0.76
Именно
0.75
然而
0.75
čini
0.75
Однако
0.75
Activations Density 1.653%
c
the
to
o
z
cence
по
و
b
se
ﺔ
然而
Međutim
تاہم
Использу
那麼
Именно
然而
čini
Однако