INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    m
    1.65
    s
    1.46
    ی
    1.36
    1.35
    ের
    1.30
    س
    1.28
    ים
    1.23
    1.20
    1.20
    ي
    1.19
    POSITIVE LOGITS
    il
    1.08
    ০০
    0.93
    BE
    0.87
    clockwise
    0.84
    ig
    0.82
    ۰۰
    0.81
     anti
    0.80
    ۰
    0.79
     I
    0.78
    LOOP
    0.77
    Act Density 0.013%

    No Known Activations