INDEX
    Explanations

    writing and authorship

    New Auto-Interp
    Negative Logits
    不太好
    -0.08
    外国语
    -0.08
    人际关系
    -0.07
    (G
    -0.07
    所在的
    -0.07
    每个人
    -0.07
    (Container
    -0.07
    [u
    -0.07
    田园
    -0.07
    .signature
    -0.06
    POSITIVE LOGITS
    Ć
    0.07
     TInt
    0.07
    .PostMapping
    0.07
    >All
    0.07
     brilliantly
    0.07
    _avg
    0.07
    Ƹ
    0.07
    	before
    0.07
    آخر
    0.07
     Apply
    0.07
    Act Density 0.095%

    No Known Activations