INDEX
    Explanations

    non-English text

    New Auto-Interp
    Negative Logits
     olema
    -0.15
    казывать
    -0.14
     হচ
    -0.14
    being
    -0.13
     হচ্ছে
    -0.13
     être
    -0.13
     होत
    -0.12
    станавли
    -0.12
     būti
    -0.12
    матривать
    -0.12
    POSITIVE LOGITS
     нафар
    0.15
     попрос
    0.13
     зроб
    0.13
     посмотр
    0.13
    слом
    0.12
     попроб
    0.12
     вый
    0.12
     помен
    0.12
     skon
    0.12
     подел
    0.12
    Act Density 0.059%

    No Known Activations