INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    ustre
    -0.08
     krv
    -0.07
    track
    -0.07
     Wald
    -0.07
    កម្ម
    -0.07
    РА
    -0.07
     leck
    -0.07
    clang
    -0.07
     sorrow
    -0.07
     vyd
    -0.07
    POSITIVE LOGITS
    inine
    0.09
    开放
    0.08
     ખુલ
    0.08
     republican
    0.08
    民主
    0.08
     speelt
    0.08
     rege
    0.08
     المفت
    0.07
     breathable
    0.07
     pequenos
    0.07
    Act Density 0.001%

    No Known Activations