INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    pac
    -0.08
     Rep
    -0.08
    Slices
    -0.07
     Pap
    -0.07
     Verw
    -0.07
     coc
    -0.07
     verw
    -0.07
    Pap
    -0.07
    -0.07
     diab
    -0.07
    POSITIVE LOGITS
     stern
    0.08
     Anne
    0.07
     pore
    0.07
     influx
    0.07
    amarin
    0.07
    AQ
    0.07
    ouvre
    0.07
     pren
    0.07
    ARM
    0.07
    0.07
    Act Density 0.002%

    No Known Activations