INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    Queen
    -0.07
     donors
    -0.07
     portrays
    -0.06
     depicts
    -0.06
    char
    -0.06
    νομ
    -0.06
    ièrement
    -0.06
     presentation
    -0.06
     barrier
    -0.06
     sys
    -0.06
    POSITIVE LOGITS
    ‌هاي
    0.07
     tieten
    0.07
     thương
    0.07
    _LANGUAGE
    0.06
    Lit
    0.06
    ไฟฟ
    0.06
    \data
    0.06
    urga
    0.06
    ватися
    0.06
     kendine
    0.06
    Act Density 0.000%

    No Known Activations