INDEX
    Explanations

    expressions of surprise or astonishment

    Exclamations or interjections

    wow, oops, and punctuation

    New Auto-Interp
    Negative Logits
    )」
    -0.70
    NUMX
    -0.68
    .」
    -0.66
    ):
    -0.64
    」,
    -0.64
    ?」
    -0.64
    ”,
    -0.63
    *</
    -0.63
    ),
    -0.62
    ()");
    -0.62
    POSITIVE LOGITS
    !
    0.82
    ,
    0.56
    ättern
    0.55
    الإنجليزية
    0.54
    ArgumentParser
    0.54
     оригіналу
    0.54
    Jep
    0.53
     woof
    0.53
    Demografie
    0.53
     doable
    0.52
    Act Density 0.118%

    No Known Activations