INDEX
Negative Logits
ill
0.80
the
0.75
ра
0.72
e
0.70
。[
0.69
ere
0.68
ها
0.68
etas
0.68
told
0.66
。「
0.64
POSITIVE LOGITS
م
0.97
ى
0.97
м
0.84
↵↵
0.81
’)
0.81
الأ
0.79
uygulama
0.77
fossil
0.77
كتابه
0.75
*/
0.74
Activations Density 0.001%
ill
the
ра
e
。[
ere
ها
etas
told
。「
م
ى
м
↵↵
’)
الأ
uygulama
fossil
كتابه
*/