INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     tern
    -0.07
    리지
    -0.07
    -by
    -0.07
     tue
    -0.07
     enlarg
    -0.07
     Enlarg
    -0.07
     integ
    -0.07
     idade
    -0.07
    uites
    -0.07
    jourd
    -0.07
    POSITIVE LOGITS
    angulo
    0.08
     Alfa
    0.08
     charms
    0.08
     praised
    0.07
     ################################
    0.07
    ész
    0.07
     announced
    0.07
     Sight
    0.07
     لمدة
    0.07
     فإذا
    0.07
    Act Density 0.000%

    No Known Activations