INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    ات
    0.98
    きた
    0.96
    de
    0.96
    ма
    0.91
     a
    0.84
    या
    0.81
    1
    0.80
    0.80
    ای
    0.80
    0.79
    POSITIVE LOGITS
     سي
    1.13
     تصميم
    0.94
     مي‌
    0.86
     türlü
    0.85
    -
    0.82
     كيفية
    0.80
     خير
    0.79
     قي
    0.78
     يش
    0.78
     تغيير
    0.78
    Act Density 0.000%

    No Known Activations