INDEX
Negative Logits
h
1.14
س
1.14
い
1.12
al
1.11
ant
1.05
f
1.00
ના
0.99
ח
0.98
د
0.97
יי
0.96
POSITIVE LOGITS
н
1.20
↵
1.18
n
0.88
是
0.87
a
0.82
STATE
0.80
ন
0.80
는
0.77
іль
0.76
м
0.76
Activations Density 0.004%
h
س
い
al
ant
f
ના
ח
د
יי
н
↵
n
是
a
STATE
ন
는
іль
м