INDEX
    Explanations

    roles and their actions

    New Auto-Interp
    Negative Logits
     دارد
    0.28
     جسے
    0.24
    ബരി
    0.24
     داره
    0.23
     Indicates
    0.22
     ਹੈ
    0.21
     जिसे
    0.21
     indicates
    0.21
     article
    0.21
     ہے۔
    0.21
    POSITIVE LOGITS
     themselves
    0.35
     தங்கள்
    0.29
     নিজেদের
    0.26
     ತಮ್ಮ
    0.25
     którzy
    0.24
     તેમના
    0.24
     ktorí
    0.23
     сами
    0.23
     ойношот
    0.22
     друг
    0.22
    Act Density 0.308%

    No Known Activations