INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     })↵↵
    -0.08
     compiler
    -0.08
    Ze
    -0.07
    Ry
    -0.07
    ยาย
    -0.07
     youthful
    -0.07
     insider
    -0.07
    .lex
    -0.07
    _discount
    -0.07
     deixam
    -0.07
    POSITIVE LOGITS
    width
    0.11
     width
    0.11
     Width
    0.11
    .width
    0.10
    .Width
    0.10
     largeur
    0.10
    Width
    0.10
     اندازه
    0.10
    ,width
    0.09
    	width
    0.09
    Act Density 0.004%

    No Known Activations