INDEX
    Explanations

    state or status updates

    New Auto-Interp
    Negative Logits
    های
    0.49
    רו
    0.46
     của
    0.45
    يز
    0.44
     של
    0.43
    ของ
    0.43
    ของการ
    0.42
    0.42
    idades
    0.38
    0.38
    POSITIVE LOGITS
     and
    0.50
     αλλά
    0.46
     és
    0.45
     и
    0.45
     так
    0.44
     And
    0.44
     pone
    0.44
    emir
    0.43
    so
    0.42
     It
    0.42
    Act Density 0.026%

    No Known Activations