INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     зна
    -0.07
     References
    -0.07
     che
    -0.07
    -sensitive
    -0.06
    )))
    ↵
    -0.06
    .RowStyles
    -0.06
    .digital
    -0.06
     co
    -0.06
    center
    -0.06
     =(
    -0.06
    POSITIVE LOGITS
    0.22
    0.20
    0.15
    0.13
    目的
    0.13
    目の
    0.13
    0.09
     mục
    0.09
    目前
    0.09
    目を
    0.09
    Act Density 0.002%

    No Known Activations