INDEX
    Explanations

    prepositions

    New Auto-Interp
    Negative Logits
     lini
    -0.08
     हेतु
    -0.08
    elwa
    -0.07
    ials
    -0.07
     ire
    -0.07
     nasi
    -0.07
     byd
    -0.07
    hadap
    -0.07
    eed
    -0.07
     fina
    -0.07
    POSITIVE LOGITS
     demikian
    0.13
     entanto
    0.10
    riez
    0.10
     الرغم
    0.09
     זאת
    0.09
    而言
    0.09
     المهم
    0.09
    此同时
    0.08
    情况下
    0.08
    ажно
    0.08
    Act Density 0.837%

    No Known Activations