INDEX
Negative Logits
that
1.24
on
1.20
1.19
(
1.18
That
1.18
*
1.12
que
1.11
من
1.08
get
1.07
to
1.07
POSITIVE LOGITS
including
1.53
/)
1.50
நபியே
1.50
англ
1.41
excluding
1.36
siehe
1.36
%)
1.32
粡
1.31
;;)
1.28
및
1.27
Activations Density 1.001%
that
on
(
That
*
que
من
get
to
including
/)
நபியே
англ
excluding
siehe
%)
粡
;;)
및