INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     carbohydrates
    -0.07
    ߘ
    -0.07
    一个人
    -0.07
    ombres
    -0.07
     empathy
    -0.07
     Knowledge
    -0.06
     proceed
    -0.06
    olicitud
    -0.06
     expenditure
    -0.06
    _FACTOR
    -0.06
    POSITIVE LOGITS
    往年
    0.07
     meisten
    0.07
    尤其是
    0.06
    0.06
    Circle
    0.06
    ität
    0.06
    (cluster
    0.06
     rit
    0.06
    FormGroup
    0.06
     Fol
    0.06
    Act Density 0.016%

    No Known Activations