INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    .cut
    -0.07
    очек
    -0.07
     Marr
    -0.06
     igen
    -0.06
    ocaust
    -0.06
     rua
    -0.06
    ยวก
    -0.06
     Brno
    -0.06
    asel
    -0.06
     mez
    -0.06
    POSITIVE LOGITS
     ambition
    0.10
     ambitions
    0.09
     ambitious
    0.09
    하지
    0.08
     사업
    0.07
    (This
    0.07
    Ст
    0.07
     المهنة
    0.07
    되지
    0.07
     idea
    0.06
    Act Density 0.004%

    No Known Activations