INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Wach
    -0.08
     tocar
    -0.07
     Decor
    -0.07
    Sou
    -0.07
     desenho
    -0.07
    outline
    -0.07
    usho
    -0.07
     És
    -0.07
    Descr
    -0.07
    verage
    -0.07
    POSITIVE LOGITS
     incorrect
    0.13
     गलत
    0.12
     Incorrect
    0.11
     चुकी
    0.11
     wrong
    0.10
    导致
    0.10
     incorrectly
    0.10
    Incorrect
    0.10
    造成
    0.10
    _wrong
    0.10
    Act Density 0.134%

    No Known Activations