INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Lord
    -0.07
     già
    -0.07
    ニニ
    -0.06
    ंगठन
    -0.06
    _LONG
    -0.06
    -0.06
    ierten
    -0.06
    وغ
    -0.06
    _profile
    -0.06
    éro
    -0.06
    POSITIVE LOGITS
    FieldName
    0.07
     clar
    0.07
     čas
    0.06
    .Sin
    0.06
    ,!
    0.06
     arms
    0.06
    0.06
     Objective
    0.06
    åde
    0.06
     Other
    0.06
    Act Density 0.004%

    No Known Activations