INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    online
    -0.08
     poverty
    -0.07
    _num
    -0.07
    Affinity
    -0.07
    Pct
    -0.07
    _bp
    -0.07
    Num
    -0.07
     fr
    -0.07
    FP
    -0.07
    _FP
    -0.07
    POSITIVE LOGITS
     Lund
    0.08
    သည္
    0.08
     vond
    0.08
     أنها
    0.08
    רי
    0.08
    ↵//↵//
    0.07
     estre
    0.07
    zna
    0.07
    строй
    0.07
     trabalh
    0.07
    Act Density 0.126%

    No Known Activations