INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     ਕੁ
    -0.09
     Accent
    -0.08
    יז
    -0.07
    463
    -0.07
     competência
    -0.07
     neu
    -0.07
    acan
    -0.07
     jun
    -0.07
    арай
    -0.07
    Dream
    -0.07
    POSITIVE LOGITS
     lát
    0.08
     cok
    0.08
     wager
    0.08
     adventurous
    0.08
     EA
    0.08
    事项
    0.07
    obei
    0.07
     Victor
    0.07
     rdr
    0.07
     Bereits
    0.07
    Act Density 0.012%

    No Known Activations