INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     أكثر
    -0.07
    	col
    -0.06
    =i
    -0.06
    obj
    -0.06
    	d
    -0.06
     dy
    -0.06
    	str
    -0.06
    .notice
    -0.06
     baptized
    -0.06
     münchen
    -0.06
    POSITIVE LOGITS
    说道
    0.07
    wcsstore
    0.07
    istics
    0.07
     хозя
    0.07
     fim
    0.06
     هدف
    0.06
    erator
    0.06
    SC
    0.06
    ाकर
    0.06
     TL
    0.06
    Act Density 0.009%

    No Known Activations