INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    تباط
    -0.07
     JP
    -0.07
     drama
    -0.07
    hunt
    -0.06
    -li
    -0.06
     tri
    -0.06
    .scale
    -0.06
     south
    -0.06
    omite
    -0.06
    .sy
    -0.06
    POSITIVE LOGITS
    О
    0.06
     Sometimes
    0.06
     (((
    0.06
     organising
    0.06
    compose
    0.06
     сайті
    0.06
     موجود
    0.06
     $('.
    0.06
    >\<
    0.06
     امور
    0.06
    Act Density 0.006%

    No Known Activations