INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    われる
    -0.07
    -winning
    -0.07
     ב
    -0.07
    _way
    -0.07
    aan
    -0.06
    国の
    -0.06
    час
    -0.06
    ViewItem
    -0.06
    شن
    -0.06
    .Total
    -0.06
    POSITIVE LOGITS
    \Middleware
    0.07
     října
    0.06
    .UTF
    0.06
     Mell
    0.06
     Utf
    0.06
     Initi
    0.06
    	bg
    0.06
     exhilar
    0.06
    	LEFT
    0.06
     dlouh
    0.05
    Act Density 0.010%

    No Known Activations