INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    commerce
    -0.07
    😊
    -0.07
    德州
    -0.07
     GX
    -0.07
     burdens
    -0.06
     paternal
    -0.06
    んですけど
    -0.06
    -0.06
    Commerce
    -0.06
    人物
    -0.06
    POSITIVE LOGITS
     Electro
    0.09
    osi
    0.07
    .After
    0.07
    istic
    0.07
     Cohen
    0.07
     Field
    0.07
     Elect
    0.07
    _AGENT
    0.07
    Elect
    0.07
    roduction
    0.07
    Act Density 0.026%

    No Known Activations