INDEX
Explanations
quantifiers followed by descriptions
New Auto-Interp
Negative Logits
a
0.38
sutures
0.33
dua
0.31
one
0.29
่า
0.29
i
0.29
Fusarium
0.28
an
0.27
ämä
0.27
mö
0.27
POSITIVE LOGITS
-
0.34
।-
0.32
EN
0.31
-'+
0.30
_
0.30
M
0.30
poseen
0.30
N
0.30
D
0.29
F
0.29
Activations Density 0.418%