INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     coef
    -0.07
    ensely
    -0.07
     Lagos
    -0.07
     Fees
    -0.07
     tỷ
    -0.06
     Millionen
    -0.06
     avril
    -0.06
    -0.06
     acres
    -0.06
     yüzde
    -0.06
    POSITIVE LOGITS
     leak
    0.07
    атор
    0.07
     Yuk
    0.07
    0.07
     Fixed
    0.07
     журнал
    0.07
    国有
    0.07
     gad
    0.07
    stick
    0.07
    UFFER
    0.06
    Act Density 0.002%

    No Known Activations