INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     congress
    -0.08
     IHttp
    -0.08
     ד
    -0.08
    -rich
    -0.08
    Sess
    -0.08
    bas
    -0.08
     déput
    -0.08
     correlation
    -0.08
    Correlation
    -0.08
     releg
    -0.07
    POSITIVE LOGITS
     يحتوي
    0.09
     fleas
    0.08
     Pumpkin
    0.08
     Rings
    0.08
     تحتوي
    0.08
     Rose
    0.07
     rings
    0.07
     Jung
    0.07
    0.07
    制作
    0.07
    Act Density 0.006%

    No Known Activations