INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     adc
    -0.08
     compelled
    -0.06
    (frames
    -0.06
     itemCount
    -0.06
     soma
    -0.06
    .depart
    -0.06
    大面积
    -0.06
     salv
    -0.06
    reflect
    -0.06
    Steam
    -0.06
    POSITIVE LOGITS
    :],
    0.08
     الجنوب
    0.07
    Deserializer
    0.07
    clearfix
    0.07
    iat
    0.07
    群体
    0.07
    个人信息
    0.06
     Tong
    0.06
    0.06
    れている
    0.06
    Act Density 0.001%

    No Known Activations