INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    uniacid
    -0.07
    	Route
    -0.07
     precedence
    -0.07
     בשביל
    -0.07
    .youtube
    -0.07
    (square
    -0.07
    📮
    -0.07
     qq
    -0.06
    🔖
    -0.06
     documented
    -0.06
    POSITIVE LOGITS
     التربية
    0.07
    0.07
    👒
    0.07
     TOM
    0.07
    0.07
    ISH
    0.06
    ComboBox
    0.06
     Label
    0.06
     NOM
    0.06
     зап
    0.06
    Act Density 0.010%

    No Known Activations