INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    しかも
    0.67
    Namun
    0.63
    Pero
    0.62
    Segundo
    0.62
    ختلف
    0.60
    0.60
     venido
    0.59
    0.59
    าวิ
    0.59
    𐰚
    0.58
    POSITIVE LOGITS
     so
    2.66
     ताकि
    2.63
     zodat
    2.42
     تاکہ
    2.36
     чтобы
    2.12
     supaya
    2.07
     lest
    2.05
    เพื่อให้
    2.05
     afin
    2.05
    以便
    2.03
    Act Density 0.795%

    No Known Activations