INDEX
Negative Logits
a
1.15
{1.05
大
0.94
f
0.90
৫
0.90
five
0.88
us
0.82
5
0.82
fü
0.81
ization
0.80
POSITIVE LOGITS
の
0.98
ล
0.91
ल
0.88
وں
0.82
נה
0.79
the
0.78
ORI
0.76
ہا
0.76
あ
0.76
ER
0.76
Activations Density 0.015%
a
{大
f
৫
five
us
5
fü
ization
の
ล
ल
وں
נה
the
ORI
ہا
あ
ER