INDEX
    Explanations

    emotional punctuation

    New Auto-Interp
    Negative Logits
    ’।
    0.48
    !!
    0.46
    !!!
    0.45
    !!!!
    0.45
     !!!!
    0.44
    」、
    0.40
     !!
    0.39
     !!!
    0.39
    」。
    0.37
    しかも
    0.37
    POSITIVE LOGITS
     :)
    1.22
    :)
    1.09
    ...)
    1.09
     😊
    1.08
    ...")
    1.05
     ;)
    1.05
    ...?
    1.05
     😉
    1.03
     🙂
    0.95
    ...')
    0.95
    Act Density 1.003%

    No Known Activations