INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Dickens
    -0.08
     Περ
    -0.07
     Entr
    -0.07
    winter
    -0.07
     bitten
    -0.07
     Frames
    -0.07
     captcha
    -0.07
    en
    -0.07
    	fclose
    -0.07
     english
    -0.06
    POSITIVE LOGITS
    oid
    0.09
    OID
    0.09
    roid
    0.08
    ROID
    0.08
     Patriots
    0.07
    oon
    0.07
    ид
    0.07
    ैद
    0.07
    _ID
    0.07
    oids
    0.06
    Act Density 0.022%

    No Known Activations