INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    SYNC
    -0.06
    тим
    -0.06
     pink
    -0.06
    ством
    -0.06
     prakt
    -0.06
     swipe
    -0.06
     phy
    -0.06
     Вик
    -0.06
     contemplating
    -0.06
     уровне
    -0.06
    POSITIVE LOGITS
     Bomb
    0.09
    889
    0.07
    ibri
    0.07
     bomb
    0.07
    حيح
    0.07
    .Department
    0.07
    0.07
    ,on
    0.07
    Hit
    0.07
    bomb
    0.07
    Act Density 0.007%

    No Known Activations