INDEX
Negative Logits
incompatible
-0.07
日に
-0.06
ı
-0.06
disarm
-0.06
دواج
-0.06
だろう
-0.06
じゃ
-0.06
ियम
-0.06
643
-0.06
ymin
-0.06
POSITIVE LOGITS
Carbon
0.08
folio
0.07
privacy
0.07
explicit
0.07
.Single
0.06
logger
0.06
جلس
0.06
_PRIVATE
0.06
William
0.06
.amount
0.06
Activations Density 0.050%