INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    -0.07
    Parents
    -0.07
    hyp
    -0.06
    winter
    -0.06
     کش
    -0.06
     kháng
    -0.06
     tang
    -0.06
     Ну
    -0.06
    -0.06
     pointless
    -0.06
    POSITIVE LOGITS
     im
    0.09
    im
    0.09
    _im
    0.08
    IM
    0.08
     Im
    0.07
    .IM
    0.07
    (im
    0.07
    aim
    0.07
    	js
    0.07
    .Im
    0.07
    Act Density 0.015%

    No Known Activations