INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     otro
    -0.07
     Aging
    -0.07
     crystall
    -0.07
    -0.06
     fiber
    -0.06
     расп
    -0.06
     đáng
    -0.06
    -or
    -0.06
    }(
    -0.06
     نگاه
    -0.06
    POSITIVE LOGITS
     {
    0.13
    {
    0.09
    {\
    0.08
    [{
    0.08
    ={
    0.08
    >{
    0.08
     {@
    0.08
     unto
    0.07
     {"
    0.07
    ({
    0.07
    Act Density 0.125%

    No Known Activations