INDEX
    Explanations

    Non-English language

    New Auto-Interp
    Negative Logits
    Activo
    -0.09
     nostru
    -0.09
     efectivos
    -0.09
     humanos
    -0.09
     muertos
    -0.08
     કર્યો
    -0.08
     stöd
    -0.08
     actos
    -0.08
     ناش
    -0.08
     ondersteunen
    -0.08
    POSITIVE LOGITS
     टीम
    0.09
    ें
    0.09
     работе
    0.09
     वजह
    0.09
     equipe
    0.08
     стороне
    0.08
     команда
    0.08
     équipe
    0.08
     जगह
    0.08
     perspectiva
    0.08
    Act Density 0.068%

    No Known Activations