INDEX
    Explanations

    linking words in multiple languages

    New Auto-Interp
    Negative Logits
     перший
    0.58
     землю
    0.57
     دوسرا
    0.57
     результаты
    0.53
     दूसरा
    0.52
     новые
    0.49
     воду
    0.49
     wyniki
    0.49
     všetky
    0.49
     первый
    0.48
    POSITIVE LOGITS
     unei
    0.61
     de
    0.58
     to
    0.56
     unor
    0.54
    0.51
     kepada
    0.50
    的一些
    0.49
    0.49
     einer
    0.47
     des
    0.46
    Act Density 0.055%

    No Known Activations