INDEX
Negative Logits
Parade
-0.08
Afro
-0.07
credited
-0.06
apor
-0.06
Universe
-0.06
universe
-0.06
karena
-0.06
داشت
-0.06
hesitate
-0.06
comer
-0.06
POSITIVE LOGITS
�
0.07
_resolve
0.07
적
0.06
_AF
0.06
grabbing
0.06
ут
0.06
代表
0.06
%M
0.06
_self
0.06
detailing
0.06
Activations Density 0.001%