INDEX
    Explanations

    patterns of dialogue or conversational exchanges.

    asking questions or offering options

    New Auto-Interp
    Negative Logits
    رخ
    0.28
    رم
    0.26
     ذریعے
    0.26
    ح
    0.25
    ه
    0.25
    ز
    0.24
    س
    0.24
     chitin
    0.24
     polytope
    0.24
     corros
    0.23
    POSITIVE LOGITS
    ?
    0.53
    ?!?
    0.53
    ؟
    0.48
    ?!
    0.47
    ?)
    0.46
    ?...
    0.44
    ?"
    0.43
    ?(
    0.42
    ?”
    0.42
     หรือ
    0.42
    Act Density 0.812%

    No Known Activations