INDEX
Negative Logits
K
1.76
N
1.53
м
1.53
H
1.45
L
1.44
S
1.39
IA
1.38
M
1.36
W
1.34
D
1.33
POSITIVE LOGITS
ουν
1.23
ών
1.21
이었다
1.16
ä
1.14
िशन
1.10
ರ
1.07
par
1.06
that
1.05
پار
1.02
ке
1.01
Activations Density 0.009%
K
N
м
H
L
S
IA
M
W
D
ουν
ών
이었다
ä
िशन
ರ
par
that
پار
ке