INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     picioare
    -0.56
     acús
    -0.54
     tatuaje
    -0.53
     acrí
    -0.52
     ślub
    -0.52
     aislado
    -0.51
     Públicas
    -0.51
     queſta
    -0.50
     climático
    -0.50
    latego
    -0.50
    POSITIVE LOGITS
    2.52
     元
    1.97
    の元
    1.50
    元的
    1.45
    元の
    1.33
    元に
    1.21
    もと
    0.90
     Yuan
    0.89
    Yuan
    0.81
     yuan
    0.75
    Act Density 0.002%

    No Known Activations