INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    变成了
    -0.07
     tenth
    -0.07
    .button
    -0.07
    了一会
    -0.07
     Boards
    -0.07
    麻将
    -0.07
     +"
    -0.07
    -0.07
    -0.07
    .JButton
    -0.07
    POSITIVE LOGITS
     pesso
    0.07
    ueur
    0.07
    coll
    0.07
     holds
    0.06
    家长
    0.06
    телем
    0.06
    ומר
    0.06
    0.06
    ания
    0.06
     hear
    0.06
    Act Density 0.001%

    No Known Activations