INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    cap
    -0.06
    .Light
    -0.06
    ActivityCreated
    -0.06
     نامه
    -0.06
     atheists
    -0.06
     pas
    -0.06
     KeyValue
    -0.06
    ри
    -0.06
    CAP
    -0.05
    	files
    -0.05
    POSITIVE LOGITS
     Auss
    0.08
     affair
    0.07
     الرياض
    0.07
    えて
    0.07
    402
    0.07
    /browse
    0.07
    KC
    0.07
    144
    0.07
     Irr
    0.06
     NEWS
    0.06
    Act Density 0.003%

    No Known Activations