INDEX
Negative Logits
们
-0.08
bur
-0.08
ultimo
-0.07
ën
-0.07
welded
-0.07
î
-0.07
nisi
-0.07
Chunk
-0.07
Hundreds
-0.07
-0.07
POSITIVE LOGITS
.language
0.09
Proj
0.08
transverse
0.08
fournisse
0.08
hoven
0.07
simplify
0.07
語
0.07
Vogel
0.07
0.07
財
0.07
Activations Density 0.004%