INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     bedienen
    -0.09
     vida
    -0.09
     viability
    -0.08
     Leib
    -0.08
     Aliment
    -0.07
     intelig
    -0.07
     mit
    -0.07
    -0.07
     Ve
    -0.07
     veja
    -0.07
    POSITIVE LOGITS
     түрде
    0.08
    0.08
    erweise
    0.08
    .pref
    0.08
     cand
    0.08
    уб
    0.08
     கவ
    0.08
    орд
    0.07
    HEL
    0.07
     നടത്തിയ
    0.07
    Act Density 0.020%

    No Known Activations