INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    -0.07
    盲目
    -0.07
    Ҥ
    -0.07
    mızda
    -0.07
    แทง
    -0.07
    (dr
    -0.07
    不确定
    -0.07
    摔倒
    -0.06
    Sz
    -0.06
    -0.06
    POSITIVE LOGITS
    0.07
     הית
    0.07
     detailing
    0.07
    ,Y
    0.07
     designing
    0.07
     pues
    0.07
    ));↵
    0.07
    فحص
    0.07
     Cor
    0.06
    Ь
    0.06
    Act Density 0.002%

    No Known Activations