INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    لی
    1.08
    ری
    0.82
    io
    0.81
    Gambar
    0.81
    İ
    0.79
    ید
    0.77
    سی
    0.76
    ای
    0.72
    c
    0.71
    들이
    0.71
    POSITIVE LOGITS
    ي
    0.92
     وي
    0.89
     هي
    0.88
    ائي
    0.86
     свобод
    0.85
     أبر
    0.84
     платфор
    0.83
     لي
    0.82
     ويل
    0.82
     أي
    0.81
    Act Density 0.002%

    No Known Activations