INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    chází
    -0.07
     قائمة
    -0.06
    etzt
    -0.06
     swims
    -0.06
    行动
    -0.06
     blows
    -0.06
    ивают
    -0.06
     OH
    -0.06
     еж
    -0.06
    ывают
    -0.06
    POSITIVE LOGITS
    -made
    0.07
    0.06
    .predict
    0.06
     HttpResponseRedirect
    0.06
     identified
    0.06
    earn
    0.06
    osen
    0.06
    prim
    0.06
    0.06
     PARAM
    0.05
    Act Density 0.081%

    No Known Activations