INDEX
Negative Logits
décennies
-0.09
Debido
-0.08
је
-0.08
WTF
-0.08
Rechnung
-0.08
compagnie
-0.07
collectiv
-0.07
cleverly
-0.07
uchte
-0.07
intermitt
-0.07
POSITIVE LOGITS
pher
0.08
III
0.07
restriction
0.07
lear
0.07
bur
0.07
ecution
0.07
oth
0.07
好了
0.07
etsy
0.07
anday
0.07
Activations Density 0.010%