INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     propName
    -0.07
     Brown
    -0.07
     بل
    -0.07
     beg
    -0.07
    เม
    -0.07
    れない
    -0.07
    -0.07
    -0.07
    Brown
    -0.07
    є
    -0.07
    POSITIVE LOGITS
    0.08
    能夠
    0.07
    老百姓
    0.07
     hypocrisy
    0.07
     <->
    0.07
    0.07
     المستوى
    0.07
    .pixel
    0.07
    .tipo
    0.07
    outputs
    0.07
    Act Density 0.004%

    No Known Activations