INDEX
Negative Logits
۔
0.60
on
0.55
드
0.55
म
0.54
리
0.54
は
0.52
।]
0.49
the
0.47
는
0.46
گ
0.46
POSITIVE LOGITS
,
0.52
ä
0.50
ното
0.45
-
0.45
us
0.44
ية
0.44
↵
0.43
ing
0.43
IN
0.42
ih
0.41
Activations Density 0.007%
۔
on
드
म
리
は
।]
the
는
گ
,
ä
ното
-
us
ية
↵
ing
IN
ih