INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Pinn
    -0.08
     kapital
    -0.08
    ازه
    -0.08
    .unmodifiable
    -0.08
    ونا
    -0.08
     bede
    -0.08
    lak
    -0.07
     Bros
    -0.07
     gand
    -0.07
     اقدامات
    -0.07
    POSITIVE LOGITS
    0.10
    ®
    0.09
    plus
    0.08
     Graves
    0.07
    Plus
    0.07
    /-
    0.07
    /U
    0.07
    _predict
    0.07
    /O
    0.07
    0.07
    Act Density 0.123%

    No Known Activations