INDEX
Negative Logits
治
-0.08
Ran
-0.08
-0.08
Ved
-0.07
itali
-0.07
порядок
-0.07
ally
-0.07
П
-0.07
Wise
-0.07
Kell
-0.07
POSITIVE LOGITS
мужчины
0.09
XN
0.08
iman
0.08
versehen
0.08
nissen
0.08
â
0.08
fuertes
0.08
लेकर
0.07
होकर
0.07
男人
0.07
Activations Density 0.055%