INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    football
    -0.08
    IOS
    -0.08
    ,n
    -0.08
     KK
    -0.08
     Peters
    -0.08
    962
    -0.08
    964
    -0.07
    ės
    -0.07
     گرفت
    -0.07
     Adult
    -0.07
    POSITIVE LOGITS
    steder
    0.08
     sober
    0.08
     sanitation
    0.08
     frigor
    0.07
    Ansi
    0.07
     الإنتاج
    0.07
     oficinas
    0.07
    Yet
    0.07
     aline
    0.07
     overseeing
    0.07
    Act Density 0.001%

    No Known Activations