INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    brakk
    -0.07
    precio
    -0.06
     Goat
    -0.06
    ,然后
    -0.06
    ła
    -0.06
    alez
    -0.06
     geht
    -0.06
     palabra
    -0.06
     aplic
    -0.06
    erging
    -0.06
    POSITIVE LOGITS
    station
    0.08
     Ludwig
    0.07
    ilter
    0.07
     manpower
    0.06
     Representatives
    0.06
    ></
    0.06
     downloadable
    0.06
    ********************************
    0.06
    ост
    0.06
     //////////////////////////////////////////////////////////////////////
    0.06
    Act Density 0.003%

    No Known Activations