INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    ى
    0.22
     класи
    0.20
     драй
    0.20
     meeste
    0.19
    ς
    0.19
    ן
    0.19
    0.19
     richting
    0.19
     ля
    0.19
     базо
    0.19
    POSITIVE LOGITS
    nek
    0.19
    nen
    0.19
     $$\
    0.18
     evt
    0.17
     Decreto
    0.17
    and
    0.17
    ણા
    0.17
    acijos
    0.17
    ulagway
    0.17
     Comissão
    0.17
    Act Density 0.266%

    No Known Activations