INDEX
    Explanations

    losing fat, gaining muscle

    New Auto-Interp
    Negative Logits
     consequence
    -0.08
    _USED
    -0.08
    电脑
    -0.08
    建立
    -0.08
    ドラ
    -0.08
    -0.07
    lickr
    -0.07
     Wird
    -0.07
     usos
    -0.07
    ARD
    -0.07
    POSITIVE LOGITS
     ใหม่
    0.09
     légèrement
    0.08
     пришлось
    0.08
     придется
    0.08
     νέο
    0.08
     ligeramente
    0.08
     чист
    0.08
     приходится
    0.08
     než
    0.08
     classifier
    0.07
    Act Density 0.007%

    No Known Activations