INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    либо
    -0.07
    رى
    -0.07
     solves
    -0.07
     vertices
    -0.07
     restore
    -0.07
    orners
    -0.07
     complained
    -0.06
     различные
    -0.06
    وجد
    -0.06
    tes
    -0.06
    POSITIVE LOGITS
     $__
    0.07
    外地
    0.07
     одежд
    0.07
    中国市场
    0.07
     TODAY
    0.07
     chuyện
    0.07
    買い物
    0.07
     casa
    0.07
    寝室
    0.07
    TON
    0.07
    Act Density 0.050%

    No Known Activations