INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    486
    -0.08
     dresses
    -0.07
    -0.06
    .setVisible
    -0.06
    推薦
    -0.06
    -money
    -0.06
    kova
    -0.06
     Artikel
    -0.06
     thứ
    -0.06
    kat
    -0.06
    POSITIVE LOGITS
     офици
    0.07
    .Cos
    0.07
    .Tile
    0.07
    =@
    0.07
     Bot
    0.07
     userInfo
    0.07
    epochs
    0.06
     <%
    0.06
     kite
    0.06
     Ка
    0.06
    Act Density 0.083%

    No Known Activations