INDEX
Negative Logits
ırı
-0.07
ig
-0.07
بغ
-0.07
Table
-0.06
firstName
-0.06
PropertyChanged
-0.06
Boss
-0.06
bek
-0.06
overl
-0.06
quotation
-0.06
POSITIVE LOGITS
umb
0.08
ación
0.07
viagra
0.07
من
0.07
sediment
0.06
_connections
0.06
ोन
0.06
mite
0.06
,[
0.06
(reason
0.06
Activations Density 0.006%