INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    fried
    -0.07
     알려
    -0.07
     исход
    -0.07
    track
    -0.06
    AttribPointer
    -0.06
    Property
    -0.06
    单位
    -0.06
     менше
    -0.06
    INFRINGEMENT
    -0.06
    adian
    -0.06
    POSITIVE LOGITS
    -dark
    0.07
    eline
    0.07
    manda
    0.06
    око
    0.06
     samostat
    0.06
     userid
    0.06
    DV
    0.06
    _gas
    0.06
     сила
    0.06
    Preparing
    0.06
    Act Density 0.000%

    No Known Activations