INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     bayi
    -0.09
     Chant
    -0.08
     ketosis
    -0.08
    协议
    -0.07
    િણ
    -0.07
     deme
    -0.07
     gbogbo
    -0.07
    公里
    -0.07
    一定
    -0.07
     ವೈದ್ಯ
    -0.07
    POSITIVE LOGITS
     fears
    0.09
     डर
    0.09
     भय
    0.08
    terror
    0.08
     coward
    0.08
     Conserv
    0.07
     Deborah
    0.07
     darr
    0.07
    خو
    0.07
     gates
    0.07
    Act Density 0.007%

    No Known Activations