INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     kinet
    -0.09
    나요
    -0.08
    \d
    -0.08
    جب
    -0.07
    What's
    -0.07
     drought
    -0.07
     understandably
    -0.07
     météo
    -0.07
     basé
    -0.07
    Whatever
    -0.07
    POSITIVE LOGITS
    左右
    0.09
    ,因为
    0.08
     aron
    0.08
     Makes
    0.07
    ,因此
    0.07
    onha
    0.07
     لت
    0.07
    ikos
    0.07
    ,使
    0.07
     آم
    0.07
    Act Density 0.019%

    No Known Activations