INDEX
Negative Logits
자
-0.07
Hình
-0.07
スの
-0.07
зд
-0.06
nob
-0.06
알고
-0.06
、お
-0.06
رئیس
-0.06
क
-0.06
ownik
-0.06
POSITIVE LOGITS
support
0.07
Support
0.07
encouragement
0.07
help
0.07
Investigations
0.07
ιστο
0.06
dg
0.06
unity
0.06
CPA
0.06
_tail
0.06
Activations Density 0.046%