INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    发出
    -0.08
    .transfer
    -0.07
    ToDo
    -0.07
     будет
    -0.07
    責任
    -0.07
    .cell
    -0.07
    在接受
    -0.07
    Executive
    -0.06
    受け
    -0.06
    开辟
    -0.06
    POSITIVE LOGITS
     Damen
    0.08
    0.08
    女の子
    0.07
    -thread
    0.07
     Fußball
    0.07
     dash
    0.07
    0.07
     emitter
    0.07
    0.07
     Angebot
    0.07
    Act Density 0.003%

    No Known Activations