INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    desired
    -0.07
    iel
    -0.07
     entertaining
    -0.06
    少し
    -0.06
     Geh
    -0.06
     retreated
    -0.06
     bombing
    -0.06
     เมษายน
    -0.06
    -domain
    -0.06
    elihood
    -0.06
    POSITIVE LOGITS
     borr
    0.07
     ملي
    0.07
    TestMethod
    0.07
    parentId
    0.07
     пам
    0.06
    .EventType
    0.06
     navr
    0.06
    [temp
    0.06
     orgasm
    0.06
     покуп
    0.06
    Act Density 0.001%

    No Known Activations