INDEX
Negative Logits
h
1.31
in
1.22
u
1.10
of
1.06
i
1.03
e
1.01
to
0.98
hla
0.96
在
0.96
tta
0.94
POSITIVE LOGITS
-
1.45
ли
1.38
行う
1.02
ни
1.00
ین
0.97
ె
0.97
ே
0.96
)
0.95
ъ
0.94
یم
0.94
Activations Density 0.005%
h
in
u
of
i
e
to
hla
在
tta
-
ли
行う
ни
ین
ె
ே
)
ъ
یم