INDEX
Negative Logits
disqualified
-0.07
worsening
-0.07
fathers
-0.07
THESE
-0.07
Prem
-0.07
first
-0.06
K
-0.06
uating
-0.06
Null
-0.06
rtl
-0.06
POSITIVE LOGITS
RelativeTo
0.08
玠
0.07
حين
0.07
המת
0.07
按摩
0.07
[self
0.07
בלי
0.07
_TRACK
0.07
cfg
0.07
ayı
0.07
Activations Density 0.006%