INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    یز
    -0.08
     GenerationType
    -0.08
     щодо
    -0.07
     zač
    -0.07
     tình
    -0.06
     RowBox
    -0.06
    ål
    -0.06
    uin
    -0.06
    영어
    -0.06
     theology
    -0.06
    POSITIVE LOGITS
     Assess
    0.07
    ึกษา
    0.06
    ////////////////////////////////////////////////////
    0.06
    elage
    0.06
     Permanent
    0.06
     cihaz
    0.06
    ilename
    0.06
     overhaul
    0.06
     Consolid
    0.06
     Adds
    0.06
    Act Density 0.013%

    No Known Activations