INDEX
    Explanations

    Sex and gender

    New Auto-Interp
    Negative Logits
    orge
    -0.08
     Points
    -0.08
     WIND
    -0.08
     gaar
    -0.08
     points
    -0.07
    ikian
    -0.07
    brite
    -0.07
     jolla
    -0.07
     Egy
    -0.07
     Devil
    -0.07
    POSITIVE LOGITS
     невер
    0.08
     сцен
    0.08
     chees
    0.08
    udd
    0.08
     autoplay
    0.08
     exploring
    0.08
     oppos
    0.08
     сторону
    0.08
     кап
    0.07
     парт
    0.07
    Act Density 0.014%

    No Known Activations