INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     рек
    -0.07
    33
    -0.07
    ंगठन
    -0.06
    otec
    -0.06
    roe
    -0.06
     phrase
    -0.06
     RCA
    -0.06
    	RE
    -0.06
     слух
    -0.06
     Tod
    -0.06
    POSITIVE LOGITS
     input
    0.13
     Input
    0.12
    Input
    0.11
    input
    0.11
    .input
    0.10
    (input
    0.10
    _inp
    0.10
     inputs
    0.09
    (Input
    0.09
    Inputs
    0.09
    Act Density 0.042%

    No Known Activations