INDEX
Negative Logits
spirits
-0.07
ışık
-0.06
.street
-0.06
.pivot
-0.06
Manager
-0.06
yürüt
-0.06
恢
-0.06
manifestations
-0.06
/\.(
-0.06
前
-0.06
POSITIVE LOGITS
ність
0.07
bogus
0.07
NAME
0.06
_mirror
0.06
;",
0.06
wrong
0.06
lli
0.06
بیرون
0.06
ْع
0.06
mirror
0.06
Activations Density 0.006%