INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    只能
    0.59
     دارم
    0.53
    可能性がある
    0.46
     असल्या
    0.46
    只好
    0.46
    我很
    0.45
     بود
    0.44
     تھا
    0.43
     ===
    0.43
     मिळाल
    0.42
    POSITIVE LOGITS
     nicht
    2.45
     ikke
    2.41
     не
    2.19
     bukan
    2.13
     नहीं
    2.09
     không
    2.02
     not
    1.98
     نہیں
    1.98
     tidak
    1.94
    nicht
    1.91
    Act Density 0.433%

    No Known Activations