INDEX
Negative Logits
Reifen
-0.09
pla
-0.08
halftime
-0.08
andir
-0.08
morning
-0.08
plats
-0.08
dazugeh
-0.08
éadfadh
-0.08
whose
-0.08
andescent
-0.07
POSITIVE LOGITS
UR
0.09
(alert
0.08
SAL
0.08
Uganda
0.08
QL
0.08
.styles
0.08
UPC
0.08
.strict
0.08
URRED
0.08
.ag
0.08
Activations Density 0.001%