INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     mellitus
    -0.09
     груди
    -0.08
    isierung
    -0.08
     north
    -0.07
     chol
    -0.07
     چون
    -0.07
     записи
    -0.07
    -0.07
    körper
    -0.07
     Stard
    -0.07
    POSITIVE LOGITS
    0.10
     Needed
    0.07
    0.07
    0.07
     dam
    0.07
     wrinkle
    0.07
     Zimmerman
    0.07
    usc
    0.07
    otse
    0.06
    优惠
    0.06
    Act Density 0.004%

    No Known Activations