INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     מא
    -0.07
     حسب
    -0.07
     gewisse
    -0.07
     mindful
    -0.07
     Gro
    -0.07
     RDC
    -0.07
    ubs
    -0.07
     flashes
    -0.07
    ovy
    -0.07
     cherish
    -0.07
    POSITIVE LOGITS
    bm
    0.08
    Stand
    0.08
     bağ
    0.08
     Anast
    0.07
    ultimate
    0.07
    gut
    0.07
     BREAK
    0.07
    Fly
    0.07
    113
    0.07
    0.07
    Act Density 0.006%

    No Known Activations