INDEX
Negative Logits
-0.08
治疗
-0.08
respe
-0.08
Butler
-0.08
cider
-0.07
(stderr
-0.07
inglesa
-0.07
incluem
-0.07
στή
-0.07
Lan
-0.07
POSITIVE LOGITS
★
0.08
gip
0.07
tranche
0.07
gp
0.07
.appspot
0.07
Peter
0.07
Sop
0.07
atria
0.07
aczego
0.07
intuit
0.07
Activations Density 0.003%