INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    vania
    -0.08
     Tipps
    -0.08
    ibar
    -0.08
     pobl
    -0.07
     Toilet
    -0.07
     Height
    -0.07
     gboolean
    -0.07
     dicas
    -0.07
     בהתאם
    -0.07
    ässä
    -0.07
    POSITIVE LOGITS
     endorsement
    0.10
     mất
    0.09
    未经
    0.09
    转载请
    0.09
    商业
    0.08
    违反
    0.08
     kinh
    0.08
     músc
    0.08
     electoral
    0.08
     коммер
    0.08
    Act Density 0.008%

    No Known Activations