INDEX
    Explanations

    research, logs

    New Auto-Interp
    Negative Logits
    只能
    -0.08
    prek
    -0.08
    -0.08
     cobre
    -0.08
    -0.08
    -0.07
     Eller
    -0.07
     parler
    -0.07
     zai
    -0.07
    WHAT
    -0.07
    POSITIVE LOGITS
     כ
    0.08
     ממ
    0.08
    .values
    0.08
    Ul
    0.07
    .value
    0.07
    _gen
    0.07
    pi
    0.07
     الان
    0.07
     passengers
    0.07
    0.07
    Act Density 0.000%

    No Known Activations