INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    جم
    -0.08
    _appro
    -0.07
    _NC
    -0.07
    _SH
    -0.07
    ableView
    -0.07
    ्षमत
    -0.06
     발견
    -0.06
    emode
    -0.06
     çiz
    -0.06
     ==============================================================
    -0.06
    POSITIVE LOGITS
     child
    0.06
     physical
    0.06
     fonction
    0.06
     Sac
    0.06
     term
    0.06
    STRACT
    0.06
     bánh
    0.06
     social
    0.06
     vag
    0.06
    ,int
    0.06
    Act Density 0.008%

    No Known Activations