INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     خودش
    -0.07
     adam
    -0.07
     offs
    -0.06
     Cove
    -0.06
    	cuda
    -0.06
     přesně
    -0.06
    Pure
    -0.06
     نیاز
    -0.06
    enze
    -0.06
    integration
    -0.06
    POSITIVE LOGITS
     record
    0.08
     Record
    0.07
    UBL
    0.07
    record
    0.07
    0.07
     Πολι
    0.07
     RECORD
    0.07
     
    0.06
    á
    0.06
    ZN
    0.06
    Act Density 0.010%

    No Known Activations