INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Schwartz
    -0.08
     Beitrag
    -0.07
    	boolean
    -0.07
     عز
    -0.07
     anz
    -0.07
     semen
    -0.07
     لض
    -0.07
    	an
    -0.07
     نوشته
    -0.07
     Key
    -0.07
    POSITIVE LOGITS
     Memor
    0.09
     memor
    0.08
    מו
    0.08
    0.08
     Cru
    0.08
    mach
    0.08
    альних
    0.08
    ikh
    0.08
    reth
    0.08
     Emp
    0.07
    Act Density 0.001%

    No Known Activations