INDEX
Negative Logits
morph
-0.06
-0.06
.dat
-0.06
yı
-0.06
spNet
-0.06
,args
-0.06
geographic
-0.06
otropic
-0.05
roky
-0.05
insulation
-0.05
POSITIVE LOGITS
<section
0.08
CTYPE
0.07
contributes
0.07
Paw
0.06
ứt
0.06
; ↵
0.06
_accounts
0.06
Catholics
0.06
match
0.06
porn
0.06
Activations Density 0.003%