INDEX
Negative Logits
hoof
-0.08
lectus
-0.08
बनी
-0.08
jun
-0.08
demás
-0.08
buah
-0.07
leo
-0.07
디
-0.07
beschreven
-0.07
vero
-0.07
POSITIVE LOGITS
_ts
0.08
يه
0.07
∀
0.07
TS
0.07
�?
0.07
.ts
0.07
�
0.07
deprivation
0.07
ært
0.07
comparator
0.07
Activations Density 0.000%