INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     laquelle
    0.30
     হুইয়
    0.30
     হইয়৷
    0.27
     inaccuracy
    0.27
     %),
    0.26
     সাহায্যে
    0.26
     compter
    0.26
    "></
    0.26
     ತನ್ನ
    0.25
    which
    0.25
    POSITIVE LOGITS
     who
    0.92
    who
    0.70
     whom
    0.67
     kteří
    0.64
     ktorí
    0.61
     quienes
    0.60
     którzy
    0.59
     الذين
    0.59
    whom
    0.58
     যারা
    0.56
    Act Density 0.159%

    No Known Activations