INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    plist
    -0.09
    ليش
    -0.08
    Lucky
    -0.08
    bootstrap
    -0.08
     darn
    -0.08
    .Time
    -0.08
     Aff
    -0.08
     سیاسی
    -0.07
     manière
    -0.07
    -0.07
    POSITIVE LOGITS
    -producing
    0.08
     ঘটে
    0.08
     iff
    0.07
    289
    0.07
     peng
    0.07
    -minus
    0.07
     tension
    0.07
     terjadi
    0.07
     ymin
    0.07
     occurs
    0.07
    Act Density 0.004%

    No Known Activations