INDEX
Negative Logits
adulta
-0.08
inhib
-0.08
inhibitory
-0.08
davanti
-0.07
tings
-0.07
Challenges
-0.07
eldet
-0.07
adulto
-0.07
Zur
-0.07
цами
-0.07
POSITIVE LOGITS
Upt
0.08
收益
0.08
"}↵
0.08
discard
0.08
incentiv
0.07
deelname
0.07
_www
0.07
incentives
0.07
Penguin
0.07
reachable
0.07
Activations Density 0.002%