INDEX
    Explanations

    quantifiable achievements

    New Auto-Interp
    Negative Logits
     nějak
    0.61
     trebuie
    0.59
     chce
    0.59
     хочет
    0.56
     trochu
    0.55
    或者
    0.52
     parece
    0.52
     inkább
    0.52
     quieres
    0.52
     पढ़ेंगे
    0.51
    POSITIVE LOGITS
     kellett
    0.70
     during
    0.64
     ছিল
    0.63
     وكان
    0.62
     তৎকালীন
    0.62
     ছিলেন
    0.60
    当时
    0.60
     وكانت
    0.59
     بودند
    0.57
    だったので
    0.57
    Act Density 0.045%

    No Known Activations