INDEX
Negative Logits
.JLabel
-0.08
بعد
-0.08
worsh
-0.07
;;;;;;;;;;;;;;;;
-0.07
ех
-0.07
_TOUCH
-0.07
doubted
-0.07
ụ
-0.07
توان
-0.07
')) ↵
-0.07
POSITIVE LOGITS
Adds
0.06
สำ
0.06
ражд
0.06
IMIT
0.06
Clippers
0.06
ダー
0.06
account
0.06
&P
0.06
Emirates
0.05
Trojan
0.05
Activations Density 0.026%