INDEX
Negative Logits
raport
-0.09
ZI
-0.09
olola
-0.08
ustre
-0.08
建设
-0.08
Parkway
-0.08
Cheque
-0.08
Romney
-0.08
Buna
-0.08
utanga
-0.08
POSITIVE LOGITS
操
0.08
劇
0.08
人生
0.08
manipulating
0.07
emotions
0.07
媒
0.07
array
0.07
probabilities
0.07
相
0.07
相
0.07
Activations Density 0.006%