INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     pig
    -0.08
     revistas
    -0.07
     това
    -0.07
     એવો
    -0.07
     ഇത്
    -0.07
    entious
    -0.07
    جيل
    -0.07
     KNR
    -0.07
     embryo
    -0.07
     trotzdem
    -0.07
    POSITIVE LOGITS
    comm
    0.08
     namely
    0.08
    ेष
    0.07
    found
    0.07
     trov
    0.07
    0.07
    Dec
    0.07
    def
    0.07
    itation
    0.07
    bp
    0.07
    Act Density 0.112%

    No Known Activations