INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    -form
    -0.07
    .on
    -0.07
    台灣
    -0.07
     courageous
    -0.06
     ********************************************************************************
    -0.06
    _form
    -0.06
     System
    -0.06
     Orioles
    -0.06
     yesterday
    -0.06
     vừa
    -0.06
    POSITIVE LOGITS
     escol
    0.06
    noxious
    0.06
    umerator
    0.06
     rin
    0.06
    ันทร
    0.05
    тар
    0.05
     conseguir
    0.05
    0.05
     kk
    0.05
     /*!<
    0.05
    Act Density 0.077%

    No Known Activations