INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    college
    -0.07
    .WebElement
    -0.07
     lorem
    -0.06
     horrible
    -0.06
    -between
    -0.06
     Jae
    -0.06
     tăng
    -0.06
     toolbar
    -0.06
    -esteem
    -0.06
     Yang
    -0.06
    POSITIVE LOGITS
    ALS
    0.07
     Vintage
    0.07
    нит
    0.06
    -sheet
    0.06
    TOTYPE
    0.06
     pitfalls
    0.06
    ديد
    0.06
    فق
    0.06
    BOT
    0.06
    uating
    0.06
    Act Density 0.003%

    No Known Activations