INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    -0.07
    تفسير
    -0.07
    尚书
    -0.07
    หลากหลาย
    -0.07
    穿戴
    -0.07
    -0.07
     Convenience
    -0.07
     próprio
    -0.07
    Cantidad
    -0.07
    держ
    -0.07
    POSITIVE LOGITS
     trava
    0.08
     jap
    0.07
    0.06
    bj
    0.06
    refixer
    0.06
     hourly
    0.06
    ForRow
    0.06
    0.06
    formedURLException
    0.06
     Someone
    0.06
    Act Density 0.002%

    No Known Activations