INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Ubisoft
    -0.07
     Iceland
    -0.07
     Adjustment
    -0.06
     gender
    -0.06
     taboo
    -0.06
    ()._
    -0.06
    不存在
    -0.06
     dẫn
    -0.06
    UNG
    -0.06
    她的
    -0.06
    POSITIVE LOGITS
     Marcus
    0.06
    hledem
    0.06
     personal
    0.06
    form
    0.06
    sizei
    0.06
     مرکز
    0.06
    ately
    0.06
     INTO
    0.06
     manufactures
    0.06
     UTF
    0.06
    Act Density 0.008%

    No Known Activations