INDEX
Negative Logits
janvier
-0.07
xec
-0.07
нельзя
-0.07
dziewcz
-0.06
stellen
-0.06
admiration
-0.06
QDialog
-0.06
npc
-0.06
Arabia
-0.06
muc
-0.06
POSITIVE LOGITS
پژوه
0.07
Huffington
0.06
.figure
0.06
.Y
0.06
elif
0.06
Refuge
0.06
iscrim
0.06
textile
0.06
enticated
0.06
*&
0.06
Activations Density 0.003%