INDEX
Negative Logits
Einladung
-0.09
_old
-0.08
/from
-0.08
719
-0.08
إ
-0.08
NUnit
-0.07
Voucher
-0.07
atriz
-0.07
đo
-0.07
[((
-0.07
POSITIVE LOGITS
occupational
0.07
therm
0.07
inc
0.07
presses
0.06
bottom
0.06
onderstaande
0.06
Massachusetts
0.06
quem
0.06
आख
0.06
dever
0.06
Activations Density 0.004%