INDEX
    Explanations

    Same-sex relationships and rights

    New Auto-Interp
    Negative Logits
     Dự
    -0.07
     hurt
    -0.07
     precedent
    -0.07
    -0.07
     השימוש
    -0.06
     Demp
    -0.06
     זהו
    -0.06
    ся
    -0.06
     SWAT
    -0.06
    'est
    -0.06
    POSITIVE LOGITS
    🍔
    0.07
    🎂
    0.07
    产业集群
    0.07
    0.07
    (calendar
    0.07
    звезд
    0.07
    闪光
    0.07
    0.07
    ycler
    0.07
    ߖ
    0.07
    Act Density 0.021%

    No Known Activations