INDEX
    Explanations

    comparisons and statistics

    New Auto-Interp
    Negative Logits
    เพื่อ
    0.47
     чтобы
    0.45
    既然
    0.45
    เพื่อให้
    0.42
     ताकि
    0.41
     puisqu
    0.41
     farklı
    0.40
     щоб
    0.40
     כדי
    0.40
     để
    0.40
    POSITIVE LOGITS
     consistently
    0.73
     compared
    0.68
     وذلك
    0.67
    compared
    0.59
     overall
    0.57
     averaged
    0.57
     dibandingkan
    0.57
     zarówno
    0.56
     consistent
    0.55
    Compared
    0.55
    Act Density 0.016%

    No Known Activations