INDEX
    Explanations

    code snippets or structured data elements

    New Auto-Interp
    Negative Logits
    ")]
    
    -0.71
    ")));
    
    -0.70
    "]);
    
    -0.68
    ]")]
    -0.68
    ']))
    
    -0.66
    '])){
    
    -0.65
    }")]
    -0.64
    CppCodeGen
    -0.63
    )");
    
    -0.60
    "];
    
    -0.60
    POSITIVE LOGITS
    ↵↵
    1.01
    1.00
                        
    0.92
                
    0.92
                    
    0.91
                                   
    0.90
                              
    0.89
                            
    0.89
                                  
    0.88
                      
    0.88
    Act Density 0.070%

    No Known Activations