INDEX
    Explanations

    fermentation

    New Auto-Interp
    Negative Logits
     orientations
    -0.09
    érales
    -0.09
     сохранить
    -0.08
    ملكة
    -0.08
     الحفاظ
    -0.08
     Wildcats
    -0.08
     रखना
    -0.08
    -head
    -0.08
     Justice
    -0.08
    urations
    -0.08
    POSITIVE LOGITS
     mellow
    0.09
     migliori
    0.08
     gradually
    0.08
    0.08
     lal
    0.08
     கர
    0.08
     langsam
    0.07
     lentamente
    0.07
     aktivitet
    0.07
     faa
    0.07
    Act Density 0.004%

    No Known Activations