INDEX
    Explanations

    specific legal or court-related terminology

    New Auto-Interp
    Negative Logits
    ThroughAttribute
    -0.83
    pyplot
    -0.81
    featureID
    -0.78
    Billie
    -0.76
    ########.
    -0.75
    دانشنامهٔ
    -0.74
     Taw
    -0.73
     Pires
    -0.72
    aarrggbb
    -0.70
    rence
    -0.70
    POSITIVE LOGITS
                            
    2.00
    						
    1.60
                             
    1.59
                          
    1.53
                           
    1.46
                                
    1.43
                              
    1.43
                        
    1.41
                         
    1.41
                               
    1.32
    Act Density 0.064%

    No Known Activations