INDEX
    Explanations

    punctuation and symbols, especially periods

    New Auto-Interp
    Negative Logits
    uali
    -0.08
    znam
    -0.07
     nues
    -0.07
    ł
    -0.07
    γη
    -0.07
    ignum
    -0.07
    ccione
    -0.07
    *pow
    -0.07
    ÏĨÎŃÏģει
    -0.07
    941
    -0.07
    POSITIVE LOGITS
     silk
    0.06
     Silk
    0.06
    arton
    0.06
     Ik
    0.06
     maxim
    0.05
    opoulos
    0.05
    coc
    0.05
    .wait
    0.05
    ÙĪØ§Ø±
    0.05
    reme
    0.05
    Act Density 0.000%

    No Known Activations