INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    River
    -0.08
    Sau
    -0.08
    THE
    -0.08
    blood
    -0.07
    στη
    -0.07
    -0.07
    -0.07
    Dou
    -0.07
    cost
    -0.07
    Rad
    -0.07
    POSITIVE LOGITS
     clarification
    0.09
     Anliegen
    0.09
     elog
    0.08
     spørsmål
    0.08
     செய்திகள்
    0.08
    0.08
     aclar
    0.08
     esclarecer
    0.07
     constate
    0.07
     wolle
    0.07
    Act Density 0.017%

    No Known Activations