INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    اج
    -0.08
    _TE
    -0.07
     Iowa
    -0.07
    LabelText
    -0.07
     bakery
    -0.07
     Escort
    -0.07
    计算机
    -0.07
     journal
    -0.07
     vak
    -0.07
    מספר
    -0.07
    POSITIVE LOGITS
     with
    0.24
    with
    0.14
     With
    0.11
     WITH
    0.09
     avec
    0.09
     com
    0.09
    -with
    0.08
    	with
    0.08
     с
    0.08
     fron
    0.08
    Act Density 0.565%

    No Known Activations