INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Proud
    -0.08
     Pere
    -0.07
     founder
    -0.07
     lice
    -0.07
    -0.07
     piracy
    -0.07
     #"
    -0.07
    -0.07
     droit
    -0.07
     #
    -0.06
    POSITIVE LOGITS
    ascending
    0.09
    _pairs
    0.09
     parámetros
    0.09
     parametros
    0.09
    Objectives
    0.09
     Меж
    0.08
     усили
    0.08
     ascending
    0.08
     параметры
    0.08
    -fields
    0.08
    Act Density 0.004%

    No Known Activations