INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     قن
    -0.08
     mo
    -0.07
    ne
    -0.07
    do
    -0.07
     broker
    -0.07
    -0.07
    _choose
    -0.07
     ni
    -0.07
     Done
    -0.07
     Mango
    -0.07
    POSITIVE LOGITS
     Electrical
    0.16
     electrical
    0.16
    rical
    0.09
    ical
    0.07
     whereby
    0.07
    атель
    0.07
    RESP
    0.07
    0.07
     Hull
    0.07
    ial
    0.07
    Act Density 0.008%

    No Known Activations