INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    .setPosition
    -0.07
     GURL
    -0.07
    ється
    -0.06
     WAR
    -0.06
     Geb
    -0.06
     setzen
    -0.06
    .ContentType
    -0.06
     War
    -0.06
    utsch
    -0.06
     pill
    -0.06
    POSITIVE LOGITS
    	api
    0.09
     ilk
    0.08
    :
    0.07
     قابل
    0.07
    یکی
    0.07
    anik
    0.06
    eve
    0.06
     سمت
    0.06
    idot
    0.06
    öße
    0.06
    Act Density 0.014%

    No Known Activations