INDEX
Negative Logits
Wol
-0.08
niña
-0.08
hur
-0.07
unin
-0.07
iman
-0.07
zeri
-0.07
folios
-0.07
(ds
-0.07
Tomas
-0.07
Dina
-0.07
POSITIVE LOGITS
еф
0.09
beweg
0.07
outage
0.07
pecial
0.07
ondere
0.07
special
0.07
עבור
0.07
igned
0.07
альтернатив
0.07
_(
0.07
Activations Density 0.000%