INDEX
Negative Logits
inversion
-0.09
op
-0.08
.op
-0.08
’ident
-0.08
ordre
-0.08
省
-0.08
,比
-0.08
(op
-0.07
’op
-0.07
Wil
-0.07
POSITIVE LOGITS
لـ
0.08
ilumin
0.08
بـ
0.08
unfolds
0.08
Babe
0.08
lantern
0.08
fraî
0.07
chand
0.07
Prostit
0.07
dazzling
0.07
Activations Density 0.001%