INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    保护
    -0.07
    Protection
    -0.07
     protección
    -0.07
     protected
    -0.07
     voda
    -0.07
    ான
    -0.07
     reparar
    -0.07
    enders
    -0.07
     والإ
    -0.07
     various
    -0.06
    POSITIVE LOGITS
    ność
    0.09
    umbuhan
    0.08
    юсь
    0.08
    ূপ
    0.08
     Fors
    0.08
    หลัก
    0.08
     Employ
    0.08
    0.08
    ulek
    0.08
    ունակում
    0.08
    Act Density 0.000%

    No Known Activations