INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     TextAlign
    -0.07
    دیگر
    -0.06
    ://'
    -0.06
    .Sprite
    -0.06
    KeyListener
    -0.06
    constitution
    -0.06
    getStatus
    -0.06
     oxide
    -0.06
     Palin
    -0.06
    graduate
    -0.06
    POSITIVE LOGITS
    0.06
    -An
    0.06
     Quar
    0.06
     диви
    0.06
    ています
    0.06
    ٨
    0.06
     Τζ
    0.06
    iration
    0.06
    ….↵↵
    0.06
    ああ
    0.06
    Act Density 0.009%

    No Known Activations