INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     personnels
    -0.08
     abduct
    -0.08
    キング
    -0.07
     volcanic
    -0.07
     succ
    -0.07
     abre
    -0.07
     Genius
    -0.07
     registre
    -0.07
    -0.07
    -0.07
    POSITIVE LOGITS
    /or
    0.08
     trough
    0.08
    minus
    0.07
     oh
    0.07
     качестве
    0.07
     coun
    0.07
    BUT
    0.07
     provision
    0.07
     beard
    0.07
     prohib
    0.07
    Act Density 0.013%

    No Known Activations