INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     ladies
    -0.08
    夫妻
    -0.08
    Fem
    -0.08
     earrings
    -0.07
    imento
    -0.07
     Fem
    -0.07
     Ionic
    -0.07
     mans
    -0.07
     Pleasant
    -0.07
     bare
    -0.07
    POSITIVE LOGITS
     छल
    0.09
     Sozial
    0.08
    0.08
     UB
    0.08
     szt
    0.07
    Оп
    0.07
     réforme
    0.07
     établi
    0.07
     সংখ্যা
    0.07
     ordinal
    0.07
    Act Density 0.030%

    No Known Activations