INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    ihan
    -0.08
     Итал
    -0.08
    	IL
    -0.07
     inhal
    -0.07
    (resources
    -0.07
     Islamic
    -0.07
     anh
    -0.07
    েসব
    -0.07
     DPI
    -0.07
     Serm
    -0.07
    POSITIVE LOGITS
     chewing
    0.08
    0.08
     osoby
    0.08
     puk
    0.07
    pour
    0.07
    Spl
    0.07
     molecules
    0.07
     autor
    0.07
     dosing
    0.07
     noc
    0.07
    Act Density 0.001%

    No Known Activations