INDEX
Negative Logits
nipple
-0.07
_USERNAME
-0.07
_preference
-0.07
legends
-0.07
endangered
-0.06
Yap
-0.06
肖
-0.06
PY
-0.06
ارية
-0.06
(Context
-0.06
POSITIVE LOGITS
wz
0.06
toh
0.06
Eng
0.06
้จ
0.06
že
0.06
.em
0.06
výrob
0.06
(:,:,
0.06
ên
0.06
teng
0.06
Activations Density 0.026%