INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     giv
    -0.09
     gained
    -0.08
    -0.08
     zusätz
    -0.08
     obtuvo
    -0.08
     rarity
    -0.08
     图片
    -0.08
    ')))↵
    -0.08
     Sorting
    -0.07
     Motto
    -0.07
    POSITIVE LOGITS
     participate
    0.09
    junto
    0.09
     participar
    0.09
     участие
    0.08
     coastal
    0.08
     participe
    0.08
     participer
    0.08
    0.08
     decis
    0.08
     таком
    0.08
    Act Density 0.228%

    No Known Activations