INDEX
    Explanations

    contrast, concession, or exception

    New Auto-Interp
    Negative Logits
    Bạn
    0.59
    あなたの
    0.56
     você
    0.54
     ඔබට
    0.50
     നിങ്ങൾക്ക്
    0.50
     ক্ষেত্রেই
    0.49
    したいと思います
    0.49
    आपको
    0.49
    TE
    0.49
    ませんので
    0.48
    POSITIVE LOGITS
     حتی
    0.63
     although
    0.58
     حتى
    0.56
     even
    0.55
     except
    0.54
     даже
    0.54
     despite
    0.53
    although
    0.51
    even
    0.49
     навіть
    0.49
    Act Density 0.043%

    No Known Activations