INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    ltal
    -0.08
    hape
    -0.08
     izinto
    -0.08
    zt
    -0.08
    viv
    -0.08
    -0.07
    Carn
    -0.07
    ch
    -0.07
    -0.07
    orig
    -0.07
    POSITIVE LOGITS
    שה
    0.09
     sust
    0.08
    _staff
    0.07
     interés
    0.07
     docente
    0.07
     मामला
    0.07
     synonymous
    0.07
     finance
    0.07
     buckets
    0.07
     moistur
    0.07
    Act Density 0.003%

    No Known Activations