INDEX
    Explanations

    after/cross

    New Auto-Interp
    Negative Logits
     â
    -0.09
     جیسے
    -0.08
    .annot
    -0.08
    ITO
    -0.08
    acct
    -0.07
    စ်
    -0.07
     Î
    -0.07
    -balanced
    -0.07
     lut
    -0.07
     kap
    -0.07
    POSITIVE LOGITS
    0.08
     व्यवहार
    0.08
     موارد
    0.08
     मामलों
    0.07
    encing
    0.07
     tránh
    0.07
     nieces
    0.07
     raff
    0.07
     jaarlijks
    0.07
    omens
    0.07
    Act Density 0.000%

    No Known Activations