INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    rup
    -0.07
     система
    -0.07
     программ
    -0.07
     AX
    -0.07
    ابی
    -0.06
     Особ
    -0.06
    :j
    -0.06
    ki
    -0.06
     HOT
    -0.06
    JI
    -0.06
    POSITIVE LOGITS
     <
    0.08
    <
    0.07
    0.07
    >\<
    0.06
    _left
    0.06
     duygu
    0.06
     вет
    0.06
     >=
    0.06
     dwind
    0.06
    .broadcast
    0.06
    Act Density 0.006%

    No Known Activations