INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     botón
    -0.08
     νέο
    -0.08
    ənin
    -0.08
     מער
    -0.08
    RGCTX
    -0.08
     weyn
    -0.08
     มกราคม
    -0.08
     hond
    -0.07
     situaties
    -0.07
     malaking
    -0.07
    POSITIVE LOGITS
     האלה
    0.10
     themselves
    0.10
     collectively
    0.09
     הללו
    0.09
     stessi
    0.08
     которые
    0.08
     были
    0.08
     אלו
    0.08
     आहेत
    0.08
     эти
    0.08
    Act Density 0.388%

    No Known Activations