INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     المخ
    -0.09
     inoc
    -0.08
     familiale
    -0.08
     gleiche
    -0.08
    .locale
    -0.08
    خة
    -0.07
    	sign
    -0.07
     niveles
    -0.07
     iguales
    -0.07
     Marshall
    -0.07
    POSITIVE LOGITS
    0.07
     passend
    0.07
     möglichst
    0.07
     تمامی
    0.07
     ಗು
    0.07
     Пос
    0.07
     സ്വ
    0.07
    ậm
    0.07
    lash
    0.07
     lask
    0.07
    Act Density 0.006%

    No Known Activations