INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     HIV
    -0.08
     στό
    -0.08
     परिच
    -0.08
    ustain
    -0.08
    apie
    -0.07
     अपराध
    -0.07
     pasi
    -0.07
     गुण
    -0.07
     संस
    -0.07
    abı
    -0.07
    POSITIVE LOGITS
    0.09
     rites
    0.08
    0.08
     పూర్త
    0.08
     osoba
    0.08
     Bonds
    0.08
     osobe
    0.08
     bonds
    0.08
     gradual
    0.08
     Schra
    0.08
    Act Density 0.006%

    No Known Activations