INDEX
    Explanations

    values numeric

    New Auto-Interp
    Negative Logits
     Italiano
    -0.08
     GAN
    -0.08
    han
    -0.07
     것입니다
    -0.07
    byen
    -0.07
     CGI
    -0.07
     recap
    -0.07
    /view
    -0.07
     Hurt
    -0.07
    shine
    -0.07
    POSITIVE LOGITS
     concret
    0.09
    具体
    0.09
    -Ste
    0.08
     concreta
    0.08
     cụ
    0.08
     concre
    0.08
     qualifying
    0.08
     PTR
    0.07
     muu
    0.07
    0.07
    Act Density 0.013%

    No Known Activations