INDEX
Negative Logits
-0.08
305
-0.08
Kendall
-0.08
Steward
-0.08
307
-0.07
-0.07
ившись
-0.07
аясь
-0.07
ҡ
-0.07
disputes
-0.07
POSITIVE LOGITS
mih
0.09
אותי
0.08
graag
0.08
مني
0.08
hr
0.08
期待
0.08
parted
0.08
HR
0.08
silly
0.08
expecting
0.08
Activations Density 0.026%