INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     eldre
    -0.08
     noirs
    -0.08
     આપ
    -0.08
     ouder
    -0.08
     presidente
    -0.07
     daju
    -0.07
    ban
    -0.07
    तिक
    -0.07
     викон
    -0.07
     yẹ
    -0.07
    POSITIVE LOGITS
     असल्य
    0.09
    anya
    0.09
     ironically
    0.08
     sadly
    0.08
     ADHD
    0.08
    orn
    0.08
     لديك
    0.08
    iddy
    0.08
     (?)
    0.08
     PTSD
    0.08
    Act Density 0.035%

    No Known Activations