INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    i
    -0.56
    ett
    -0.55
    erte
    -0.52
    iest
    -0.51
     Jes
    -0.51
    en
    -0.50
    sted
    -0.50
    er
    -0.50
     AssemblyCompany
    -0.49
    atguigu
    -0.49
    POSITIVE LOGITS
     mères
    0.53
     excès
    0.52
     puissante
    0.50
    ranean
    0.50
     supérieurs
    0.50
     qualités
    0.49
     aveug
    0.48
     mauvaises
    0.47
     commerciales
    0.47
     modificación
    0.47
    Act Density 0.081%

    No Known Activations