INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     تاکہ
    0.49
     zodat
    0.38
     để
    0.34
     جهت
    0.33
     ताकि
    0.32
    是为了
    0.31
     nhằm
    0.31
    เพื่อให้
    0.31
     เพื่อ
    0.31
     deems
    0.30
    POSITIVE LOGITS
     akibat
    0.87
     dzięki
    0.75
    จากการ
    0.74
     grâce
    0.72
     благодаря
    0.71
     بسبب
    0.70
     نتيجة
    0.66
     díky
    0.66
     вследствие
    0.66
     quando
    0.65
    Act Density 0.513%

    No Known Activations