INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     کسان
    -0.08
    nable
    -0.08
    .pending
    -0.08
     چیزی
    -0.08
     təmin
    -0.08
     Groupe
    -0.08
     offrant
    -0.08
     ارائه
    -0.08
     اح
    -0.08
     wary
    -0.07
    POSITIVE LOGITS
    itse
    0.07
    0.07
    posite
    0.07
     Above
    0.07
    _even
    0.07
     depicting
    0.07
     ésta
    0.07
    eschool
    0.07
    زياء
    0.07
     ausp
    0.06
    Act Density 0.001%

    No Known Activations