INDEX
Negative Logits
érc
-0.07
wealth
-0.07
Wealth
-0.07
Sele
-0.07
propName
-0.07
immune
-0.06
-item
-0.06
Sweden
-0.06
aldo
-0.06
<v
-0.06
POSITIVE LOGITS
/table
0.08
finished
0.08
丰富多彩
0.07
�
0.07
EXPER
0.07
BEFORE
0.07
.UTC
0.07
整個
0.07
致使
0.07
głos
0.07
Activations Density 0.005%