INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    Hmm
    -0.08
     Tass
    -0.07
     cybers
    -0.07
    że
    -0.07
     päivä
    -0.07
     trà
    -0.07
    Ст
    -0.07
    Constr
    -0.07
    vere
    -0.07
     postpartum
    -0.07
    POSITIVE LOGITS
     দুটি
    0.10
     двумя
    0.09
    两个
    0.09
    双方
    0.09
     two
    0.09
    _two
    0.08
     രണ്ട്
    0.08
     ಎರಡು
    0.08
    สอง
    0.08
     ঠিক
    0.08
    Act Density 0.025%

    No Known Activations