INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    wait
    -0.07
    wai
    -0.07
     czyli
    -0.07
     अर्थात
    -0.07
     zwar
    -0.07
     одному
    -0.07
     shock
    -0.07
    fila
    -0.07
    476
    -0.07
     immersion
    -0.07
    POSITIVE LOGITS
    ıda
    0.10
    事項
    0.09
     doy
    0.08
    (site
    0.08
     Albion
    0.08
     cuantos
    0.08
    }")]↵
    0.08
    (dl
    0.08
    .*")]↵
    0.07
     Kes
    0.07
    Act Density 0.005%

    No Known Activations