INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    ppa
    -0.08
     abuse
    -0.07
    ZONE
    -0.07
    uddy
    -0.07
    farm
    -0.07
     svoj
    -0.07
     companion
    -0.07
    Fitness
    -0.07
     vibe
    -0.07
    Mam
    -0.07
    POSITIVE LOGITS
     জানা
    0.09
    _quantity
    0.08
     إر
    0.08
    оғ
    0.08
     œ
    0.08
     məl
    0.08
     לנו
    0.08
     الحركة
    0.08
    -known
    0.08
     حاصل
    0.08
    Act Density 0.011%

    No Known Activations