INDEX
    Explanations

    multilingual pronouns and possessives

    New Auto-Interp
    Negative Logits
    !।
    0.29
    0.28
     மற்றும்
    0.28
    および
    0.27
    0.27
     আৰু
    0.27
    0.27
     (\%)
    0.26
     һәм
    0.26
    0.25
    POSITIVE LOGITS
    0.33
    自己的
    0.29
    自己
    0.29
     nějak
    0.28
     mình
    0.26
    多少
    0.26
    0.26
     अपने
    0.25
    那些
    0.25
    0.24
    Act Density 0.028%

    No Known Activations