INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Hadd
    -0.08
     موضوع
    -0.08
     Pediatrics
    -0.08
     anak
    -0.07
     کاربرد
    -0.07
    下午
    -0.07
    (environment
    -0.07
    ługi
    -0.07
     infantil
    -0.07
     acessórios
    -0.07
    POSITIVE LOGITS
    urit
    0.08
     stat
    0.08
    verte
    0.07
     sodass
    0.07
    contain
    0.07
     preset
    0.07
    coords
    0.07
     prer
    0.07
    .Target
    0.07
     noter
    0.07
    Act Density 0.006%

    No Known Activations