INDEX
    Explanations

    Italian-flavored English

    New Auto-Interp
    Negative Logits
     ’’
    0.70
    0.68
     ‘’
    0.64
     ‘‘
    0.63
     &#
    0.61
    0.61
    &#
    0.59
    0.59
    0.59
    0.56
    POSITIVE LOGITS
    1.66
       
    1.12
              
    1.00
          
    0.99
         
    0.97
             
    0.95
           
    0.90
               
    0.88
            
    0.86
                 
    0.84
    Act Density 0.080%

    No Known Activations