INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Biol
    -0.07
    ().'
    -0.07
    President
    -0.07
    なくなって
    -0.07
    -0.06
    ולת
    -0.06
    .Orders
    -0.06
     zamówienia
    -0.06
    -0.06
    _bin
    -0.06
    POSITIVE LOGITS
    0.08
    rites
    0.07
    0.07
    GL
    0.07
    -ps
    0.07
     Paragraph
    0.07
     narrow
    0.07
     פו
    0.07
     wh
    0.07
    0.07
    Act Density 0.003%

    No Known Activations