INDEX
    Explanations

    possessive prepositions and suffixes

    New Auto-Interp
    Negative Logits
     lesquelles
    0.26
     гуляць
    0.25
     komm
    0.25
     pretending
    0.25
     lesquels
    0.25
     allez
    0.25
     بیچ
    0.24
     naprawdę
    0.24
     можливість
    0.24
    regation
    0.23
    POSITIVE LOGITS
     của
    0.49
     των
    0.44
     của
    0.40
     של
    0.37
    ของ
    0.37
    នៃ
    0.37
     της
    0.35
     του
    0.33
    ของการ
    0.32
     dello
    0.31
    Act Density 0.066%

    No Known Activations