INDEX
Negative Logits
d
1.33
a
1.21
.
1.21
_
1.02
s
0.98
ur
0.96
اك
0.95
einzel
0.94
c
0.89
0.89
POSITIVE LOGITS
catastrophes
1.10
も
1.09
،
1.08
도
1.05
ком
1.02
grooming
1.02
mites
0.98
তা
0.97
veled
0.97
ない
0.96
Activations Density 0.001%
d
a
.
_
s
ur
اك
einzel
c
catastrophes
も
،
도
ком
grooming
mites
তা
veled
ない