INDEX
Negative Logits
UK
-0.08
罩
-0.08
clichés
-0.08
fds
-0.07
,count
-0.07
Birmingham
-0.07
umn
-0.07
Founder
-0.07
Lords
-0.07
predicate
-0.07
POSITIVE LOGITS
tomato
0.08
하
0.08
결
0.08
ကို
0.08
-mediated
0.08
geldi
0.07
.comments
0.07
خلال
0.07
DEL
0.07
vilket
0.07
Activations Density 0.000%