INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     وسي
    -0.08
     التدريب
    -0.07
     elbow
    -0.07
     установить
    -0.07
     Wang
    -0.07
    mania
    -0.07
     horarios
    -0.07
     Degree
    -0.07
    -0.07
    حي
    -0.07
    POSITIVE LOGITS
    iom
    0.08
     చెంద
    0.08
    自然
    0.08
    导致
    0.08
    Natur
    0.08
     мар
    0.08
     beautifully
    0.07
    0.07
     agit
    0.07
     చెందిన
    0.07
    Act Density 0.009%

    No Known Activations