INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    âncias
    -0.08
    ntu
    -0.08
     schwarz
    -0.08
     handed
    -0.08
     ADM
    -0.08
     affid
    -0.08
    čku
    -0.08
     алког
    -0.08
    ALLOC
    -0.08
     webmaster
    -0.07
    POSITIVE LOGITS
    0.07
     confusion
    0.07
     baj
    0.07
     جاری
    0.07
    0.07
     UI
    0.07
    gur
    0.07
     нормы
    0.07
    人士
    0.06
    Charges
    0.06
    Act Density 0.000%

    No Known Activations