INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     znajdu
    -0.08
    .nl
    -0.08
     mentorship
    -0.07
    (.)
    -0.07
     znajduje
    -0.07
     درد
    -0.07
    主体
    -0.07
     груди
    -0.07
     Meu
    -0.07
    ْم
    -0.07
    POSITIVE LOGITS
    Necessary
    0.08
     conditions
    0.08
     gesprochen
    0.07
     Oblig
    0.07
     обязатель
    0.07
    Assignable
    0.07
    REC
    0.07
    ални
    0.07
    conditions
    0.07
    Conditions
    0.07
    Act Density 0.007%

    No Known Activations