INDEX
Negative Logits
큐
-0.09
개의
-0.08
мира
-0.08
والز
-0.07
cura
-0.07
зак
-0.07
оохран
-0.07
candidatura
-0.07
return
-0.07
perks
-0.07
POSITIVE LOGITS
incurred
0.15
惨
0.12
pérdidas
0.11
损
0.10
suffered
0.10
pertes
0.10
loss
0.09
.loss
0.09
losses
0.09
verlies
0.09
Activations Density 0.013%