INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Man
    -0.07
    rt
    -0.07
    _tr
    -0.07
    -0.06
    oy
    -0.06
    -0.06
    vers
    -0.06
    rn
    -0.06
    -P
    -0.06
    _def
    -0.06
    POSITIVE LOGITS
     setBackgroundImage
    0.08
    0.07
    老家
    0.07
    ureka
    0.07
     Omni
    0.07
    utschen
    0.07
    非常明显
    0.07
     Gäste
    0.07
    应有的
    0.07
     externally
    0.06
    Act Density 0.002%

    No Known Activations