INDEX
Negative Logits
Hang
-0.08
enschapp
-0.07
respected
-0.07
特色
-0.07
interface
-0.07
Interface
-0.07
mes
-0.07
in
-0.07
_border
-0.07
baie
-0.07
POSITIVE LOGITS
Alternate
0.11
(Change
0.10
Replacing
0.10
Improved
0.09
替
0.09
(change
0.09
改善
0.09
verbessert
0.09
Proposal
0.09
Impro
0.09
Activations Density 0.037%