INDEX
Negative Logits
(dom
-0.08
продаж
-0.08
Ibrahim
-0.07
spit
-0.07
Domino
-0.07
voucher
-0.07
(sol
-0.07
.coordinate
-0.07
blah
-0.07
apat
-0.07
POSITIVE LOGITS
preferable
0.08
तम
0.08
好
0.08
Than
0.08
욱
0.08
ाधिक
0.08
accustomed
0.08
_than
0.08
好的
0.07
契
0.07
Activations Density 0.007%