INDEX
Negative Logits
müş
-0.07
.bulk
-0.07
dac
-0.06
preced
-0.06
ре
-0.06
vững
-0.06
Lahore
-0.06
publi
-0.06
yukarı
-0.06
Asp
-0.06
POSITIVE LOGITS
Odd
0.08
iyi
0.07
(jLabel
0.06
Anonymous
0.06
je
0.06
ΟΙ
0.06
備
0.06
express
0.06
出来
0.06
conserv
0.06
Activations Density 0.050%