INDEX
Negative Logits
Wash
-0.09
(mx
-0.08
Change
-0.07
clues
-0.07
change
-0.07
和平
-0.07
mg
-0.07
Change
-0.07
amin
-0.07
cps
-0.07
POSITIVE LOGITS
-funded
0.10
-assisted
0.09
сме
0.09
컬
0.08
থাকার
0.08
.scroll
0.08
строитель
0.08
zumindest
0.08
لخوا
0.08
-appointed
0.08
Activations Density 0.014%