INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     EN
    -0.07
    στε
    -0.07
     isten
    -0.06
     Adding
    -0.06
     Herz
    -0.06
     리스트
    -0.06
    ΜΑΤ
    -0.06
     دست
    -0.06
     사라
    -0.06
    лит
    -0.06
    POSITIVE LOGITS
     искус
    0.07
     област
    0.06
    Dispatch
    0.06
    `=
    0.06
     çalışma
    0.06
    'яз
    0.06
     feeding
    0.06
    DefaultCellStyle
    0.06
    -svg
    0.06
     través
    0.06
    Act Density 0.004%

    No Known Activations