INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     committing
    -0.08
    Insight
    -0.08
    -0.08
    _bs
    -0.08
    ص
    -0.08
    kih
    -0.07
    营业
    -0.07
    exc
    -0.07
    VID
    -0.07
    습니까
    -0.07
    POSITIVE LOGITS
     Ache
    0.09
     friction
    0.08
     Barnes
    0.08
     grav
    0.08
     Mari
    0.08
     போது
    0.07
     Alkohol
    0.07
     Herv
    0.07
    	img
    0.07
     gründ
    0.07
    Act Density 0.009%

    No Known Activations