INDEX
    Explanations

    patterns of whitespace and formatting in the text

    New Auto-Interp
    Negative Logits
     Mier
    -0.91
    tieth
    -0.91
    LikeLike
    -0.85
     CHtml
    -0.83
    stdc
    -0.80
    ("."
    -0.80
     Ruto
    -0.79
    .”
    -0.79
     gogh
    -0.79
     setw
    -0.78
    POSITIVE LOGITS
                 
    1.49
    												
    0.99
    											
    0.81
                          
    0.79
    ècie
    0.76
                  
    0.75
    ecu
    0.74
     '../../../../
    0.72
                         
    0.70
                     
    0.69
    Act Density 0.220%

    No Known Activations