INDEX
    Explanations

    programming constructs `if`, `that`, `which`

    New Auto-Interp
    Negative Logits
    你的
    0.61
    YOUR
    0.59
    Your
    0.56
    your
    0.54
    Votre
    0.53
    自己的
    0.52
    OUR
    0.52
    我的
    0.52
    our
    0.51
     ваша
    0.50
    POSITIVE LOGITS
     we
    0.74
     you
    0.68
     einen
    0.66
     мы
    0.66
     আমরা
    0.63
     আপনাকে
    0.63
     você
    0.62
     используется
    0.62
     आपको
    0.62
     используются
    0.61
    Act Density 0.323%

    No Known Activations