INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    ana
    -0.07
     Qu
    -0.07
     Jahres
    -0.07
     dalla
    -0.06
    łem
    -0.06
     gest
    -0.06
     Lars
    -0.06
     Oslo
    -0.06
    gest
    -0.06
    μπο
    -0.06
    POSITIVE LOGITS
     Province
    0.20
    Province
    0.09
    _proto
    0.07
     Senate
    0.07
    _link
    0.07
    ⠀⠀
    0.06
     Franklin
    0.06
    Configure
    0.06
     Prov
    0.06
    .getElementsByClassName
    0.06
    Act Density 0.005%

    No Known Activations