INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     punct
    -0.08
     major
    -0.08
     detail
    -0.08
     gram
    -0.07
     тех
    -0.07
    _SIMPLE
    -0.07
     quote
    -0.07
     LO
    -0.07
    \[
    -0.07
     cob
    -0.07
    POSITIVE LOGITS
    에는
    0.08
    _iv
    0.08
     wszystkim
    0.08
     Registers
    0.08
     பகுதியில்
    0.08
    ()
    0.08
     approves
    0.08
     Magistr
    0.08
    FLAGS
    0.08
    我要
    0.08
    Act Density 0.009%

    No Known Activations