INDEX
    Explanations

    criterion validity

    New Auto-Interp
    Negative Logits
     아니다
    -0.08
     προσω
    -0.08
     publiée
    -0.08
     ਨਹ
    -0.08
    'ono
    -0.08
     पढ़
    -0.08
     résident
    -0.08
     아니
    -0.08
     Zoe
    -0.08
    -0.08
    POSITIVE LOGITS
     hang
    0.07
       
    0.07
    ோம்
    0.07
     lend
    0.07
     взгля
    0.07
     Moscow
    0.07
    ym
    0.07
     realtime
    0.07
     Tomorrow
    0.07
     byl
    0.07
    Act Density 0.000%

    No Known Activations