INDEX
Negative Logits
an
-0.08
카
-0.07
--->
-0.07
Alert
-0.07
mask
-0.07
Gall
-0.07
제
-0.07
Intent
-0.06
给
-0.06
mắc
-0.06
POSITIVE LOGITS
0.08
wood
0.08
ewhat
0.08
cis
0.08
installs
0.07
reim
0.07
复工复
0.07
PW
0.07
ux
0.07
0.07
Activations Density 0.011%