INDEX
Negative Logits
b
0.42
'
0.40
-
0.37
ad
0.36
z
0.35
g
0.34
an
0.34
s
0.34
i
0.31
’
0.31
POSITIVE LOGITS
ক
0.36
on
0.34
يت
0.33
き
0.33
บน
0.32
ัน
0.31
것
0.31
uite
0.30
تم
0.30
ری
0.29
Activations Density 0.913%
b
'
-
ad
z
g
an
s
i
’
ক
on
يت
き
บน
ัน
것
uite
تم
ری