INDEX
Negative Logits
tor
-0.08
sew
-0.08
ność
-0.08
ğ
-0.08
hero
-0.08
àwọn
-0.08
ności
-0.08
lut
-0.07
žení
-0.07
.Message
-0.07
POSITIVE LOGITS
നിയമ
0.09
соглаш
0.08
SQL
0.08
Resolve
0.08
原则
0.08
laws
0.08
dictum
0.08
restraint
0.08
SAFE
0.08
আইন
0.08
Activations Density 0.008%