INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    عين
    -0.09
    wise
    -0.08
    ذاب
    -0.08
    متع
    -0.08
    由于
    -0.08
     হোৱা
    -0.08
    -wise
    -0.08
     lyon
    -0.08
    קומען
    -0.08
    داة
    -0.08
    POSITIVE LOGITS
    0.15
    0.13
     పని
    0.12
    工作
    0.11
     工作
    0.11
     working
    0.10
     పనిచ
    0.10
     additional
    0.09
     extra
    0.09
    Working
    0.09
    Act Density 0.017%

    No Known Activations