INDEX
Negative Logits
Da
-0.07
load
-0.07
Derby
-0.07
Robot
-0.06
)],
-0.06
flu
-0.06
radiation
-0.06
_HT
-0.06
ضان
-0.06
ブ
-0.06
POSITIVE LOGITS
影
0.07
.IP
0.07
eerie
0.07
nímu
0.07
_keeper
0.07
онів
0.07
sev
0.07
�ng
0.06
viol
0.06
log
0.06
Activations Density 0.011%