INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    '
    0.69
    		
    0.65
    ار
    0.56
     Nue
    0.55
    <tr>
    0.55
    	
    0.53
     Vitamins
    0.52
    									
    0.50
    €™
    0.50
    щей
    0.50
    POSITIVE LOGITS
     end
    1.16
    end
    1.03
    0.96
     End
    0.91
     концов
    0.90
    End
    0.88
    端的
    0.85
    ToEnd
    0.83
     кін
    0.74
     конец
    0.73
    Act Density 0.027%

    No Known Activations