INDEX
Negative Logits
x
-0.08
arr
-0.08
can
-0.08
gérer
-0.07
d
-0.07
kandi
-0.07
mc
-0.07
Candy
-0.07
déb
-0.07
Gim
-0.07
POSITIVE LOGITS
isun
0.08
)،
0.08
�
0.08
flange
0.08
spolit
0.08
stechn
0.08
гүй
0.07
fern
0.07
Fashion
0.07
caric
0.07
Activations Density 0.003%