INDEX
Negative Logits
い
2.64
ʀ
2.64
मद्देनजर
2.61
ᴍ
2.52
ᴘ
2.47
ုန်
2.46
И
2.45
ਉਣ
2.45
jší
2.44
ective
2.44
POSITIVE LOGITS
دة
3.32
ed
3.24
in
2.97
വ
2.84
ज
2.73
د
2.69
ling
2.60
CII
2.58
ित
2.57
व
2.55
Activations Density 0.052%
い
ʀ
मद्देनजर
ᴍ
ᴘ
ုန်
И
ਉਣ
jší
ective
دة
ed
in
വ
ज
د
ling
CII
ित
व