INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    -0.06
    alim
    -0.06
    کر
    -0.06
    เกาะ
    -0.06
    anca
    -0.06
     arada
    -0.06
     multin
    -0.06
     spectacle
    -0.06
    那里
    -0.06
    etric
    -0.06
    POSITIVE LOGITS
    _Top
    0.07
     взрос
    0.07
     змін
    0.07
     RSVP
    0.06
    _pcm
    0.06
     Genç
    0.06
     كنت
    0.06
     Ant
    0.06
     slož
    0.06
     Uran
    0.06
    Act Density 0.006%

    No Known Activations