INDEX
Negative Logits
těz
-0.08
爷
-0.07
Pass
-0.07
CWE
-0.07
textfield
-0.06
belt
-0.06
хто
-0.06
endphp
-0.06
909
-0.06
ctrine
-0.06
POSITIVE LOGITS
_argv
0.07
Occupation
0.07
くれる
0.06
bố
0.06
financier
0.06
اهرة
0.06
implicated
0.06
σχ
0.06
Superv
0.06
$b
0.06
Activations Density 0.005%