INDEX
Negative Logits
冲
-0.09
takk
-0.08
🏼
-0.08
(lang
-0.08
Sn
-0.08
ੀਂ
-0.07
紙
-0.07
VO
-0.07
剪
-0.07
(rank
-0.07
POSITIVE LOGITS
ug
0.10
neat
0.10
faint
0.09
insol
0.09
/is
0.09
buzz
0.09
unim
0.09
omorphic
0.08
aware
0.08
Muk
0.08
Activations Density 1.652%