INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     kadar
    -0.06
    ='"+
    -0.06
     πως
    -0.06
    .rule
    -0.06
    delegate
    -0.06
    .How
    -0.06
     trò
    -0.06
    	        	
    -0.06
    varchar
    -0.06
     stakeholders
    -0.05
    POSITIVE LOGITS
     полностью
    0.07
     Fusion
    0.07
     Perkins
    0.07
    ηση
    0.07
     fusion
    0.07
     Cool
    0.07
    σεων
    0.07
     perf
    0.07
     фин
    0.07
     перевір
    0.07
    Act Density 0.001%

    No Known Activations