INDEX
Negative Logits
hopp
-0.08
Orient
-0.08
reine
-0.07
Spam
-0.07
-air
-0.07
Spider
-0.07
gane
-0.07
longe
-0.07
gewinnen
-0.07
bond
-0.07
POSITIVE LOGITS
proporcional
0.13
generosity
0.10
restitution
0.10
proportional
0.09
donations
0.09
公平
0.09
额度
0.09
.amount
0.09
محد
0.09
generously
0.08
Activations Density 0.018%