INDEX
Negative Logits
t
1.42
↵↵
1.13
1.13
'
1.10
d
1.00
\
1.00
tä
0.93
joka
0.91
dan
0.89
as
0.86
POSITIVE LOGITS
ین
1.45
on
1.34
ರ
1.33
К
1.23
ج
1.23
ای
1.21
up
1.19
ویز
1.18
リ
1.18
میم
1.17
Activations Density 0.053%
t
↵↵
'
d
\
tä
joka
dan
as
ین
on
ರ
К
ج
ای
up
ویز
リ
میم