INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    705
    -0.09
     Harris
    -0.08
    MPP
    -0.08
     PCP
    -0.08
     TValue
    -0.08
    -PC
    -0.08
    279
    -0.07
     dollars
    -0.07
    ennes
    -0.07
     bucks
    -0.07
    POSITIVE LOGITS
     सुव
    0.08
    トップ
    0.08
    0.07
    0.07
     homenagem
    0.07
     शब्द
    0.07
     welkom
    0.07
    ะแ
    0.07
     गुणवत्ता
    0.07
     kualitas
    0.07
    Act Density 0.004%

    No Known Activations