INDEX
    Explanations

    multiple languages

    New Auto-Interp
    Negative Logits
     necesita
    -0.08
    ходим
    -0.08
    antai
    -0.08
     Belt
    -0.07
    ptăm
    -0.07
     seemingly
    -0.07
    -0.07
    ldə
    -0.07
     antibiotic
    -0.07
    售价
    -0.07
    POSITIVE LOGITS
     lar
    0.08
     Kam
    0.08
    Kam
    0.08
     Hist
    0.07
     तौर
    0.07
    oper
    0.07
     läbi
    0.07
     यही
    0.07
     lên
    0.07
    Hy
    0.07
    Act Density 0.124%

    No Known Activations