INDEX
    Explanations

    self-compassion

    New Auto-Interp
    Negative Logits
    igos
    -0.08
     Encourage
    -0.08
     Fashion
    -0.07
     dissect
    -0.07
     fad
    -0.07
     Feeling
    -0.07
     شع
    -0.07
     malo
    -0.07
    aktion
    -0.07
     तौर
    -0.07
    POSITIVE LOGITS
    ്ര
    0.08
     LTC
    0.08
    0.08
     cq
    0.08
    രാജ
    0.08
     cn
    0.08
    stvo
    0.08
    দেশ
    0.07
    اما
    0.07
    ourced
    0.07
    Act Density 0.003%

    No Known Activations