INDEX
Negative Logits
beaut
-0.07
iet
-0.07
ENAME
-0.06
pretending
-0.06
prest
-0.06
dac
-0.06
Bund
-0.06
UNIQUE
-0.06
ult
-0.06
計
-0.06
POSITIVE LOGITS
!!
0.08
/window
0.07
))),
0.07
рук
0.06
μείο
0.06
_("0.06
altın
0.06
(DIR
0.06
riteln
0.06
Strange
0.06
Activations Density 0.001%