INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    امي
    -0.07
     ово
    -0.06
     алког
    -0.06
    ีค
    -0.06
    -no
    -0.06
     patrol
    -0.06
    rama
    -0.06
     destruct
    -0.06
    ном
    -0.06
     signings
    -0.06
    POSITIVE LOGITS
    0.06
     اسر
    0.06
     scored
    0.06
     	   
    0.06
    **)&
    0.06
    Gb
    0.06
    Kat
    0.06
    self
    0.06
    LV
    0.06
    SES
    0.06
    Act Density 0.003%

    No Known Activations