INDEX
    Explanations

    references to pride events and celebrations

    New Auto-Interp
    Negative Logits
     miêu
    -0.13
    raquo
    -0.12
    øj
    -0.12
    itten
    -0.12
    ãĥĿ
    -0.12
    IVO
    -0.12
    usher
    -0.11
    inky
    -0.11
    aler
    -0.11
    ึà¹ī
    -0.11
    POSITIVE LOGITS
     PAR
    1.10
     Par
    1.10
    -par
    1.10
    Par
    1.08
    par
    1.05
     par
    1.02
    PAR
    1.02
    .par
    0.97
    _par
    0.96
    .Par
    0.94
    Act Density 0.442%

    No Known Activations