INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    .tax
    -0.07
    ubyte
    -0.07
    نموذ
    -0.07
     ful
    -0.07
     закон
    -0.06
    ну
    -0.06
    vince
    -0.06
    .bind
    -0.06
    很多人
    -0.06
     Nintendo
    -0.06
    POSITIVE LOGITS
     disagreed
    0.08
     seguir
    0.07
    \Mail
    0.07
    וגש
    0.07
    .GetFiles
    0.07
    非常に
    0.07
    .After
    0.07
     och
    0.07
    illery
    0.06
    йдет
    0.06
    Act Density 0.002%

    No Known Activations