INDEX
    Explanations

    ChatGPT developer mode prompts

    New Auto-Interp
    Negative Logits
    czas
    -0.09
    zonder
    -0.08
    Pero
    -0.08
    -less
    -0.08
     ورب
    -0.08
    ിട്ട്
    -0.07
    Vrij
    -0.07
    ിട്ട
    -0.07
    кр
    -0.07
    шихся
    -0.07
    POSITIVE LOGITS
    .sex
    0.08
     menstru
    0.07
    .sw
    0.07
     Unicorn
    0.07
     עש
    0.07
     Tattoos
    0.07
    $text
    0.07
     ув
    0.07
     Outro
    0.07
    .write
    0.07
    Act Density 0.001%

    No Known Activations