INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    əmiyyət
    -0.09
    'effet
    -0.08
    UIP
    -0.07
     Kru
    -0.07
    kbd
    -0.07
     skillet
    -0.07
    .isfile
    -0.07
    -friendly
    -0.07
    PWD
    -0.07
     edilir
    -0.07
    POSITIVE LOGITS
    annah
    0.08
    0.08
    …………………………………………
    0.08
     י
    0.08
     বলা
    0.07
    ,”
    0.07
     যার
    0.07
     landscaped
    0.07
    ​​​​
    0.07
    ­
    0.07
    Act Density 0.006%

    No Known Activations