INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    leich
    -0.07
     membres
    -0.07
     Elig
    -0.07
     euler
    -0.06
     zero
    -0.06
    -0.06
     harek
    -0.06
    -0.06
     lehet
    -0.06
    entialAction
    -0.06
    POSITIVE LOGITS
    indsay
    0.07
     repositories
    0.07
     DOC
    0.07
    achment
    0.06
     Jeans
    0.06
     interesting
    0.06
     nakne
    0.06
    лятор
    0.06
     اون
    0.06
    794
    0.06
    Act Density 0.003%

    No Known Activations