INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     panc
    -0.07
    linha
    -0.07
    /fire
    -0.07
    空间
    -0.07
    _png
    -0.07
     todo
    -0.07
    Hover
    -0.07
    _MOUSE
    -0.07
     бух
    -0.06
    Ba
    -0.06
    POSITIVE LOGITS
    TON
    0.07
    InstanceOf
    0.06
    してい
    0.06
    ton
    0.06
     controlId
    0.06
    0.06
    ыт
    0.06
    -off
    0.06
    inality
    0.06
                     
    0.06
    Act Density 0.012%

    No Known Activations