INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     количе
    -0.07
    ็นท
    -0.06
    _out
    -0.06
    ічної
    -0.06
     doctr
    -0.06
    ████
    -0.06
     futuro
    -0.06
    -0.06
    	cl
    -0.06
    těz
    -0.06
    POSITIVE LOGITS
    ap
    0.19
    p
    0.17
    AP
    0.17
    ip
    0.16
    op
    0.15
    P
    0.15
    ep
    0.15
     JP
    0.14
    pp
    0.14
    pe
    0.14
    Act Density 0.452%

    No Known Activations