INDEX
Negative Logits
позволит
-0.09
-Allow
-0.08
ifier
-0.08
싶은
-0.08
Lü
-0.08
тэй
-0.08
итут
-0.08
-factor
-0.08
ifies
-0.08
ظيف
-0.08
POSITIVE LOGITS
inaugurated
0.08
(土
0.08
east
0.08
Emma
0.08
ık
0.07
anning
0.07
交通
0.07
颜色
0.07
Saud
0.07
荒
0.07
Activations Density 0.003%