INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     الأف
    -0.09
     Besucher
    -0.08
    ños
    -0.08
     أهمية
    -0.08
     Tome
    -0.07
     پرو
    -0.07
     Scientists
    -0.07
    -0.07
    ীরা
    -0.07
     gpointer
    -0.07
    POSITIVE LOGITS
     seizures
    0.08
     requires
    0.08
     liability
    0.08
    requires
    0.08
    Falls
    0.08
    <?>
    0.08
     ബാധ
    0.08
     आरोप
    0.08
     misconduct
    0.08
     warranted
    0.07
    Act Density 0.012%

    No Known Activations