INDEX
    Explanations

    English language

    New Auto-Interp
    Negative Logits
    本科
    -0.08
     ұсы
    -0.08
     ops
    -0.07
     frozen
    -0.07
     colleagues
    -0.07
     podium
    -0.07
    celer
    -0.07
     colega
    -0.07
     الأرب
    -0.07
     ladies
    -0.07
    POSITIVE LOGITS
    Sum
    0.09
     thay
    0.09
     Sum
    0.08
     Rien
    0.08
     sums
    0.07
    0.07
    .eas
    0.07
     handheld
    0.07
     Citrus
    0.07
    bij
    0.07
    Act Density 0.015%

    No Known Activations