INDEX
Negative Logits
.paper
-0.08
MCU
-0.07
aktuellen
-0.06
Grad
-0.06
getUsers
-0.06
dependent
-0.06
.Ac
-0.06
�
-0.06
chein
-0.06
igit
-0.06
POSITIVE LOGITS
-friendly
0.12
riendly
0.08
billig
0.07
friendly
0.07
terrorist
0.07
باید
0.07
friendly
0.07
democratic
0.07
counterpart
0.06
Lint
0.06
Activations Density 0.005%