INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    .constraint
    -0.07
    sink
    -0.06
     яй
    -0.06
    AppComponent
    -0.06
     drifted
    -0.06
     automát
    -0.06
     Ί
    -0.06
    .jms
    -0.06
    verte
    -0.06
     Mary
    -0.06
    POSITIVE LOGITS
     gebruik
    0.07
     DataType
    0.07
    {
    0.07
    verage
    0.07
    BOSE
    0.06
     části
    0.06
     waktu
    0.06
    rysler
    0.06
     libs
    0.06
    0.06
    Act Density 0.005%

    No Known Activations