INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    geno
    -0.08
    гор
    -0.08
     gott
    -0.08
    pine
    -0.08
    PASS
    -0.08
    արգ
    -0.07
    	gl
    -0.07
    addle
    -0.07
    	pass
    -0.07
    ุม
    -0.07
    POSITIVE LOGITS
     tarvit
    0.09
    0.08
     خطاب
    0.08
     wist
    0.07
     را
    0.07
     financiamento
    0.07
     itm
    0.07
     indruk
    0.07
     álbum
    0.07
     الاسم
    0.07
    Act Density 0.000%

    No Known Activations