INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    _calc
    -0.07
     potr
    -0.07
    -loop
    -0.07
    /f
    -0.07
     облад
    -0.07
     faced
    -0.07
    其次
    -0.07
     lime
    -0.07
     또한
    -0.07
    -0.07
    POSITIVE LOGITS
    ,仅
    0.09
    ורי
    0.08
    ,只
    0.08
     ninguno
    0.07
     шту
    0.07
     tru
    0.07
     понадоб
    0.07
     pupọ
    0.07
     কোনো
    0.07
     suure
    0.07
    Act Density 0.003%

    No Known Activations