INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    se
    -0.08
    ungen
    -0.08
     secular
    -0.08
    wan
    -0.08
    ای
    -0.08
    Separ
    -0.08
    sw
    -0.07
     bands
    -0.07
     opslag
    -0.07
    seb
    -0.07
    POSITIVE LOGITS
     Lietuvos
    0.08
     Ζ
    0.08
     infatti
    0.08
    0.08
     продуктов
    0.08
     Ovo
    0.08
     لجميع
    0.08
     Fresh
    0.07
     abz
    0.07
    .You
    0.07
    Act Density 0.001%

    No Known Activations