INDEX
Negative Logits
Vers
-0.08
某
-0.08
尤其
-0.08
波
-0.08
_subplot
-0.08
具有
-0.07
IZ
-0.07
inventive
-0.07
巧
-0.07
_plot
-0.07
POSITIVE LOGITS
ares
0.08
halte
0.08
yc
0.08
tranny
0.08
gard
0.08
diretor
0.08
shaving
0.08
gobernador
0.07
wez
0.07
orney
0.07
Activations Density 0.035%