INDEX
Negative Logits
omas
-0.09
uniform
-0.08
consequential
-0.08
demanding
-0.08
BRA
-0.08
hardest
-0.08
넘어
-0.08
overal
-0.08
ificando
-0.08
friend's
-0.08
POSITIVE LOGITS
。据
0.11
,据
0.10
?↵↵
0.09
sometime
0.09
??↵↵
0.09
angeb
0.08
某
0.08
或者
0.08
oder
0.08
或
0.08
Activations Density 0.075%