INDEX
Negative Logits
�
-0.09
�
-0.09
pu
-0.08
-même
-0.08
�
-0.07
Dos
-0.07
Fantasy
-0.07
gast
-0.07
lovable
-0.07
وع
-0.07
POSITIVE LOGITS
imation
0.09
imated
0.08
Yas
0.07
敦
0.07
extrap
0.07
ustin
0.07
.accept
0.07
submissions
0.07
cimento
0.07
tol
0.07
Activations Density 0.022%