INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     envy
    -0.09
    -0.08
     attempts
    -0.08
    υ
    -0.08
     હુમ
    -0.07
    (/*
    -0.07
     hide
    -0.07
     endeavors
    -0.07
     pursuits
    -0.07
    -на
    -0.07
    POSITIVE LOGITS
     निभ
    0.12
     played
    0.12
     jouent
    0.11
    作用
    0.10
     joué
    0.10
    发挥
    0.10
     gespeeld
    0.10
     role
    0.09
     spiller
    0.09
     भूमिका
    0.09
    Act Density 0.053%

    No Known Activations