INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    สาม
    -0.08
    说起
    -0.07
    _totals
    -0.07
    förder
    -0.06
    ************************************************************************
    -0.06
    ܩ
    -0.06
     زمن
    -0.06
    ɚ
    -0.06
    utomation
    -0.06
    \Abstract
    -0.06
    POSITIVE LOGITS
     fires
    0.07
    在意
    0.07
    _saved
    0.06
    0.06
    0.06
     enhanced
    0.06
    Ws
    0.06
     Chili
    0.06
    ��
    0.06
    ني
    0.06
    Act Density 0.002%

    No Known Activations