INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    DEBUG
    -0.07
    unte
    -0.07
     clk
    -0.07
     meld
    -0.07
    𬀩
    -0.07
    umat
    -0.07
    מדבר
    -0.07
     sust
    -0.07
    _maker
    -0.07
    SMTP
    -0.07
    POSITIVE LOGITS
     forgiving
    0.08
    0.07
     TX
    0.06
     الطبيعي
    0.06
     TOO
    0.06
    		           
    0.06
    \Services
    0.06
     Spielberg
    0.06
    .graphics
    0.06
    0.06
    Act Density 0.006%

    No Known Activations