INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Потому
    0.53
     এখনই
    0.41
     потому
    0.41
     ஆண்டுகளுக்கு
    0.41
     ஆண்டுகள்
    0.40
     করলে
    0.39
     защото
    0.38
    次は
    0.38
    改めて
    0.38
    ையிலும்
    0.37
    POSITIVE LOGITS
     since
    4.44
    since
    4.06
     منذ
    3.70
     Since
    3.66
    Since
    3.63
     sejak
    3.59
     seit
    3.47
     depuis
    3.39
     sinds
    3.11
     desde
    2.91
    Act Density 0.057%

    No Known Activations