INDEX
    Explanations

    punctuation marks, especially sentence-ending characters

    New Auto-Interp
    Negative Logits
    andag
    -0.65
    -0.63
     fag
    -0.62
    städ
    -0.61
     Rptr
    -0.60
     Argus
    -0.59
    leſs
    -0.58
     VEGET
    -0.58
    Ï
    -0.57
     vs
    -0.57
    POSITIVE LOGITS
    2.23
    1.62
    )。
    1.60
    %。
    1.40
    )。
    1.40
     。
    1.38
    ”。
    1.30
    ۔
    1.23
    .。
    1.16
     ہیں۔
    1.14
    Act Density 0.041%

    No Known Activations