INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    CPP
    -0.08
    door
    -0.08
    ilo
    -0.08
    lyn
    -0.07
    .N
    -0.07
     تتح
    -0.07
     verbal
    -0.07
     CPP
    -0.07
     CGI
    -0.07
    -0.07
    POSITIVE LOGITS
    &gt
    0.09
    &apos
    0.08
    ்ரீ
    0.08
     dold
    0.08
    -нибудь
    0.08
     ताक
    0.08
     pesan
    0.07
     dort
    0.07
     Dort
    0.07
    发财
    0.07
    Act Density 0.017%

    No Known Activations