INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     poli
    -0.08
    ہم
    -0.08
    -0.08
    امین
    -0.08
     υπο
    -0.07
     profund
    -0.07
     inoltre
    -0.07
    wrk
    -0.07
     റെ
    -0.07
    ign
    -0.07
    POSITIVE LOGITS
     constat
    0.08
     Maven
    0.08
     grazing
    0.07
     Messe
    0.07
     tricky
    0.07
     přij
    0.07
     Zir
    0.07
     oriented
    0.07
    0.07
    October
    0.07
    Act Density 0.010%

    No Known Activations