INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    1
    1.03
    0.79
    0.79
    ков
    0.77
    0.77
    но
    0.75
    ل
    0.73
    РИ
    0.71
    ig
    0.71
    ів
    0.70
    POSITIVE LOGITS
    s
    0.79
    ?’
    0.79
     بندی
    0.73
     آباد
    0.73
    uksen
    0.71
    extended
    0.70
     هستند
    0.69
     آیا
    0.69
     extended
    0.68
    0.67
    Act Density 0.002%

    No Known Activations