INDEX
Negative Logits
،
1.65
are
1.55
are
1.45
re
1.35
tiin
1.28
te
1.26
s
1.23
,“
1.16
,
1.16
was
1.15
POSITIVE LOGITS
ية
1.36
لي
1.32
’
1.30
לה
1.07
ைகள்
1.05
शील
1.03
похо
1.03
לו
0.99
použit
0.99
ROME
0.99
Activations Density 0.116%
،
are
are
re
tiin
te
s
,“
,
was
ية
لي
’
לה
ைகள்
शील
похо
לו
použit
ROME