INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    цы
    -0.08
    .addCell
    -0.07
     dóla
    -0.07
     יצא
    -0.07
     nós
    -0.07
    -0.06
     essere
    -0.06
    -0.06
     If
    -0.06
    的功能
    -0.06
    POSITIVE LOGITS
    	protected
    0.08
    0.07
    0.07
    /**<
    0.07
    0.07
    Argument
    0.07
    油耗
    0.07
     IK
    0.07
    很开心
    0.07
     CORS
    0.07
    Act Density 0.007%

    No Known Activations