INDEX
Negative Logits
tik
0.78
0.77
t
0.75
the
0.74
ainkan
0.73
và
0.72
utilises
0.71
marginalised
0.70
Rosso
0.70
maju
0.68
POSITIVE LOGITS
的
0.84
ة
0.82
ת
0.80
ים
0.77
૧
0.72
೧
0.69
鳖
0.69
同
0.68
ปี
0.68
他
0.68
Activations Density 0.001%
tik
t
the
ainkan
và
utilises
marginalised
Rosso
maju
的
ة
ת
ים
૧
೧
鳖
同
ปี
他