INDEX
    Explanations

    alcohol by volume

    New Auto-Interp
    Negative Logits
     palabras
    -0.07
     lui
    -0.06
    ́
    -0.06
    dz
    -0.06
    nds
    -0.06
    ,用
    -0.06
    就会
    -0.06
    .extern
    -0.06
    dato
    -0.06
     kalan
    -0.06
    POSITIVE LOGITS
     Francesco
    0.07
     brit
    0.07
     pravděpodob
    0.07
     preparation
    0.06
    電視
    0.06
    ESSAGE
    0.06
     aiding
    0.06
    _home
    0.06
    /disc
    0.06
    formik
    0.06
    Act Density 0.005%

    No Known Activations