INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     erst
    -0.09
     تائين
    -0.09
    faker
    -0.08
    VALUE
    -0.08
     پاڻ
    -0.08
     ਆਪਣ
    -0.08
    itser
    -0.08
     overgang
    -0.07
    -0.07
     pyst
    -0.07
    POSITIVE LOGITS
     direta
    0.08
     divina
    0.08
     básica
    0.07
    HOT
    0.07
     dasar
    0.07
    GET
    0.07
     directe
    0.07
     garlic
    0.07
    -www
    0.07
     directa
    0.07
    Act Density 0.031%

    No Known Activations