INDEX
Negative Logits
manslaughter
-0.07
зни
-0.07
devant
-0.06
квар
-0.06
breastfeeding
-0.06
("***-0.06
¨ط
-0.06
enjoying
-0.06
가지고
-0.06
sdl
-0.06
POSITIVE LOGITS
ipv
0.07
(ins
0.06
vale
0.06
跳
0.06
ΜΑ
0.06
yle
0.06
Qué
0.06
WIFI
0.06
-go
0.06
Preview
0.06
Activations Density 0.003%