INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     أحمد
    -0.07
    -0.07
    .connect
    -0.07
    :"
    -0.07
     yaygın
    -0.07
    backend
    -0.07
    =Integer
    -0.06
    知情
    -0.06
     един
    -0.06
    -rule
    -0.06
    POSITIVE LOGITS
     Kristen
    0.08
    cimiento
    0.08
    怎么会
    0.07
     cytok
    0.07
    0.07
    0.07
    nova
    0.06
     Chrome
    0.06
    icast
    0.06
     elic
    0.06
    Act Density 0.009%

    No Known Activations