INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    iq
    -0.08
    قة
    -0.08
    iselwa
    -0.07
    okw
    -0.07
     lwjgl
    -0.07
     Convers
    -0.07
    hdr
    -0.07
    治疗
    -0.07
    ,对于
    -0.07
    idue
    -0.07
    POSITIVE LOGITS
     моря
    0.08
     punish
    0.08
    0.08
    -ger
    0.08
     вла
    0.07
     SOCIAL
    0.07
     населения
    0.07
     submarine
    0.07
     Offshore
    0.07
     group's
    0.07
    Act Density 0.000%

    No Known Activations