INDEX
Negative Logits
er's
-0.08
aped
-0.08
\\/
-0.08
ted
-0.08
.sk
-0.08
\\
-0.08
izacao
-0.07
the
-0.07
zk
-0.07
ean
-0.07
POSITIVE LOGITS
QUESTION
0.09
Hmm
0.09
_DICT
0.08
赌博
0.08
怕
0.08
期开
0.08
Talking
0.07
句话
0.07
debate
0.07
ophones
0.07
Activations Density 0.155%