INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Bread
    -0.08
     peaks
    -0.06
     Faith
    -0.06
     bead
    -0.06
    Boss
    -0.06
    :UIControl
    -0.06
    代理
    -0.06
     سه
    -0.06
    وزه
    -0.06
     идет
    -0.06
    POSITIVE LOGITS
     mur
    0.09
     Mur
    0.09
    ur
    0.07
    	wp
    0.07
     Pv
    0.07
     emo
    0.07
     annihil
    0.07
    Mur
    0.07
    UR
    0.07
     yaşlı
    0.07
    Act Density 0.003%

    No Known Activations