INDEX
    Explanations

    prompt/question

    New Auto-Interp
    Negative Logits
    -0.08
    කා
    -0.07
    -0.07
     recoil
    -0.07
    م
    -0.07
    -0.07
    šel
    -0.07
     imaging
    -0.07
    ವಾಗಿ
    -0.07
     OC
    -0.07
    POSITIVE LOGITS
     préciser
    0.08
    igue
    0.08
     beforehand
    0.08
     уточ
    0.08
     dores
    0.08
    _into
    0.07
     précédente
    0.07
     toucher
    0.07
     Kane
    0.07
     piernas
    0.07
    Act Density 0.014%

    No Known Activations