INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     حلقات
    0.46
    0.45
    0.45
    IdleSync
    0.44
     ایپل
    0.43
    0.43
    🤚
    0.41
     algodón
    0.41
    农业
    0.40
    NUMX
    0.40
    POSITIVE LOGITS
                    
    0.56
    			
    0.52
                
    0.51
                        
    0.48
    "
    0.48
    								
    0.47
    				
    0.44
            
    0.44
                  
    0.43
    		
    0.43
    Act Density 0.011%

    No Known Activations