INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    مایش
    -0.08
     Beteilig
    -0.08
    Sect
    -0.08
     החד
    -0.07
    所在
    -0.07
    右翼
    -0.07
    612
    -0.07
     ধৰ
    -0.07
    iene
    -0.07
     subdued
    -0.07
    POSITIVE LOGITS
     ebook
    0.08
    .skip
    0.08
    .SK
    0.08
     Ebook
    0.08
    โปร
    0.08
    frist
    0.07
     للخ
    0.07
     scaff
    0.07
     opting
    0.07
     skipping
    0.07
    Act Density 0.001%

    No Known Activations