INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     supervise
    -0.09
    aru
    -0.08
     malfunction
    -0.08
    -0.08
     оборуд
    -0.08
     observers
    -0.08
    -af
    -0.08
    -0.07
     gehör
    -0.07
    /he
    -0.07
    POSITIVE LOGITS
     factorial
    0.13
     skład
    0.08
    :@"%
    0.08
     payroll
    0.08
    0.07
    асаб
    0.07
     brisk
    0.07
    Descending
    0.07
     Dig
    0.07
    ерап
    0.07
    Act Density 0.025%

    No Known Activations