INDEX
Negative Logits
allgeme
-0.08
yollar
-0.08
mov
-0.08
uctus
-0.08
taxi
-0.07
terp
-0.07
Taxi
-0.07
Tooth
-0.07
flag
-0.07
العمليات
-0.07
POSITIVE LOGITS
manship
0.08
wrapper
0.08
сана
0.07
oupper
0.07
�
0.07
/B
0.07
abor
0.07
s
0.07
」、
0.07
proteção
0.07
Activations Density 0.015%