INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     figuring
    -0.08
    .sax
    -0.07
     šk
    -0.07
    .hist
    -0.07
    .views
    -0.07
     commenting
    -0.07
    Solo
    -0.07
    halb
    -0.07
     Roh
    -0.07
     جنگ
    -0.07
    POSITIVE LOGITS
     löyty
    0.09
     löytyy
    0.09
    	found
    0.09
     목표
    0.09
    ('\
    0.09
     खोज
    0.08
     found
    0.08
     हासिल
    0.08
    Found
    0.08
     ditemukan
    0.08
    Act Density 0.004%

    No Known Activations