INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    लोगों
    0.51
    bk
    0.43
    ubahan
    0.43
    eningkatan
    0.43
    imizi
    0.43
    un
    0.42
    ataan
    0.42
    ang
    0.41
     войны
    0.41
    wallepics
    0.41
    POSITIVE LOGITS
     this
    0.65
     цього
    0.57
     этой
    0.54
     هذا
    0.53
     این
    0.51
     acest
    0.50
     этом
    0.48
     цьому
    0.48
     этого
    0.48
     этот
    0.46
    Act Density 0.034%

    No Known Activations