INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     permet
    -0.08
     الان
    -0.08
    stemming
    -0.08
     silo
    -0.08
     wona
    -0.08
     talab
    -0.07
     مطابق
    -0.07
    engr
    -0.07
     Tak
    -0.07
     kern
    -0.07
    POSITIVE LOGITS
     relativamente
    0.08
    _RATIO
    0.08
     상대
    0.08
    菜单
    0.08
     campuses
    0.08
     בפר
    0.07
    (empty
    0.07
    ùa
    0.07
    北京市
    0.07
     relativement
    0.07
    Act Density 0.007%

    No Known Activations