INDEX
Negative Logits
what
-2.27
to
-1.60
their
-1.50
{-1.45
eight
-1.45
before
-1.43
Before
-1.41
six
-1.38
nine
-1.38
three
-1.35
POSITIVE LOGITS
andere
1.48
wherein
1.38
chercheurs
1.38
autres
1.38
ньому
1.35
œufs
1.34
huiles
1.34
atized
1.30
カットソー
1.29
других
1.28
Activations Density 0.088%