INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     lax
    -0.09
     laps
    -0.08
     grand
    -0.08
     frontal
    -0.07
     مستقل
    -0.07
     hän
    -0.07
    -0.07
     swell
    -0.07
     ocup
    -0.07
    -0.07
    POSITIVE LOGITS
     ubiquitous
    0.08
    0.08
    0.07
    Heather
    0.07
    0.07
    .Should
    0.07
    Plastic
    0.07
     Transitional
    0.07
     PROC
    0.07
    0.07
    Act Density 0.005%

    No Known Activations