INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    arela
    -0.09
    गर
    -0.09
     finales
    -0.08
     лак
    -0.08
     काय
    -0.08
     npm
    -0.08
    urar
    -0.08
    ælde
    -0.08
    aters
    -0.08
     ವರ್�
    -0.08
    POSITIVE LOGITS
    $\
    0.08
     meng
    0.08
    关于
    0.07
    Destroyed
    0.07
     of
    0.07
    Cantidad
    0.07
     across
    0.07
     dues
    0.07
    owing
    0.07
    emp
    0.07
    Act Density 0.041%

    No Known Activations