INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     affairs
    -0.08
    ڊي
    -0.08
    بيق
    -0.07
    יט
    -0.07
     регули
    -0.07
     стаб
    -0.07
     тщательно
    -0.07
    овор
    -0.07
     deriv
    -0.07
    abino
    -0.07
    POSITIVE LOGITS
     Lance
    0.08
     Appreci
    0.08
     END
    0.08
    راه
    0.08
    apsed
    0.07
    Sac
    0.07
    0.07
     Guerr
    0.07
     appreciating
    0.07
     Sister
    0.07
    Act Density 0.019%

    No Known Activations