INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    -0.09
    -0.08
    izi
    -0.08
     giants
    -0.07
    巨大
    -0.07
    Instagram
    -0.07
    TS
    -0.07
    _z
    -0.07
    -0.07
    Tik
    -0.07
    POSITIVE LOGITS
     मृत्यु
    0.10
     फार
    0.09
     penalties
    0.09
     паст
    0.09
     mortality
    0.09
     штраф
    0.09
     квартир
    0.08
    Penalty
    0.08
    0.08
     cuotas
    0.08
    Act Density 0.002%

    No Known Activations