INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     management
    -0.08
     trav
    -0.07
     verm
    -0.07
     어느
    -0.07
     repayment
    -0.06
    _unc
    -0.06
    再现
    -0.06
     ramps
    -0.06
    してる
    -0.06
    -0.06
    POSITIVE LOGITS
    就近
    0.07
     cellar
    0.07
    call
    0.06
     Category
    0.06
    .Transform
    0.06
    不忘初心
    0.06
    キッチン
    0.06
    אזור
    0.06
    Fields
    0.06
    .Block
    0.06
    Act Density 0.002%

    No Known Activations