INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    SION
    -0.07
    -0.07
    机动车
    -0.07
    number
    -0.07
    iangle
    -0.07
    现金
    -0.07
    马来
    -0.07
    	ERR
    -0.07
    -0.06
    ジャー
    -0.06
    POSITIVE LOGITS
    0.07
    0.07
     słab
    0.07
    .publish
    0.07
     fauc
    0.07
     condu
    0.06
    داول
    0.06
     wre
    0.06
     najle
    0.06
    0.06
    Act Density 0.007%

    No Known Activations