INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    ej
    -0.10
    gran
    -0.08
    eit
    -0.08
     prostate
    -0.07
    -0.07
     bay
    -0.07
     gro
    -0.07
     sidel
    -0.07
     Kore
    -0.07
    aph
    -0.07
    POSITIVE LOGITS
    zf
    0.08
    präsident
    0.08
     Americana
    0.07
    0.07
    _arch
    0.07
    fu
    0.07
     WM
    0.07
     vect
    0.07
    )));
    0.07
     sec
    0.07
    Act Density 0.010%

    No Known Activations