INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     получила
    -0.08
     ਕੀ
    -0.07
     получили
    -0.07
     Parteien
    -0.07
    秘书
    -0.07
     להגיע
    -0.07
     отвеч
    -0.07
    paq
    -0.07
     haute
    -0.07
     Organ
    -0.07
    POSITIVE LOGITS
    214
    0.08
    ((*
    0.08
    ประเทศไทย
    0.07
    79
    0.07
     dota
    0.07
    제로
    0.07
    0.07
     ))↵
    0.07
    yii
    0.07
    )//
    0.07
    Act Density 0.026%

    No Known Activations