INDEX
Negative Logits
ände
-0.09
联盟
-0.08
déi
-0.07
最高
-0.07
Spect
-0.07
Heidelberg
-0.07
Patterns
-0.07
alleviate
-0.07
▀
-0.07
东
-0.07
POSITIVE LOGITS
(single
0.10
_single
0.09
single
0.09
cir
0.09
single
0.08
lone
0.08
exces
0.08
singles
0.08
(dist
0.08
danger
0.08
Activations Density 0.001%