INDEX
Negative Logits
K
1.34
c
1.20
R
1.20
O
1.20
D
1.15
G
1.14
Y
1.13
czł
1.09
M
1.09
W
1.09
POSITIVE LOGITS
هم
1.44
ના
1.20
のは
1.19
ни
1.13
ุ
1.13
ners
1.09
1.09
lays
1.02
larda
0.99
σ
0.98
Activations Density 0.716%
K
c
R
O
D
G
Y
czł
M
W
هم
ના
のは
ни
ุ
ners
lays
larda
σ