INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     pertinentes
    -0.07
     Yuk
    -0.07
     pener
    -0.07
     Runs
    -0.07
    	de
    -0.07
     Shock
    -0.07
     focal
    -0.07
     cpp
    -0.07
    irg
    -0.07
     Taylor
    -0.07
    POSITIVE LOGITS
     mord
    0.09
    マン
    0.09
     Hum
    0.08
     Bers
    0.08
     Mina
    0.08
    .mask
    0.07
     biopsy
    0.07
    0.07
    غان
    0.07
     humm
    0.07
    Act Density 0.024%

    No Known Activations