INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    -0.08
    notification
    -0.07
     Communist
    -0.07
    /ss
    -0.07
    كرة
    -0.07
    借款
    -0.07
    เมน
    -0.07
     rake
    -0.07
    -0.07
     ought
    -0.07
    POSITIVE LOGITS
     lighting
    0.10
    最后一次
    0.07
    0.07
     bereits
    0.07
    0.07
    0.06
     Entr
    0.06
    サイト
    0.06
     Anim
    0.06
     advisable
    0.06
    Act Density 0.006%

    No Known Activations