INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    GR
    -0.08
    _phys
    -0.07
    _nth
    -0.07
    /basic
    -0.07
    .nombre
    -0.07
    _instr
    -0.07
    alm
    -0.07
    Failed
    -0.07
     intentionally
    -0.07
     School
    -0.07
    POSITIVE LOGITS
    0.08
    lsx
    0.07
    TeX
    0.07
    0.07
    ǂ
    0.07
    0.07
     soit
    0.07
    ענה
    0.07
    に入って
    0.07
    副教授
    0.07
    Act Density 0.001%

    No Known Activations