INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     وجه
    -0.10
    بيه
    -0.09
    电视剧
    -0.08
    来自
    -0.08
     bow
    -0.08
    วี
    -0.08
    راک
    -0.08
     رضي
    -0.07
    -0.07
     امرأة
    -0.07
    POSITIVE LOGITS
    NE
    0.08
    Nz
    0.08
    heits
    0.07
    Blank
    0.07
    ulent
    0.07
    _blank
    0.07
     Sturm
    0.07
     Ministries
    0.07
    azz
    0.07
     NE
    0.07
    Act Density 0.004%

    No Known Activations