INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     তাঁদের
    0.79
     كانوا
    0.71
    他们的
    0.69
    他們的
    0.64
     terão
    0.63
     வருகின்றனர்
    0.62
     смогут
    0.61
     byli
    0.60
     होंगी
    0.59
     كلهم
    0.59
    POSITIVE LOGITS
    2.63
    2.30
     it
    2.28
     its
    2.16
    它可以
    2.05
    Its
    1.97
     ĝi
    1.97
    它是
    1.95
     Its
    1.93
    它的
    1.75
    Act Density 0.081%

    No Known Activations