INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    еліг
    -0.06
    ціон
    -0.06
    'order
    -0.06
    -0.06
    'es
    -0.06
    joy
    -0.06
    -load
    -0.06
     xd
    -0.06
     promise
    -0.06
     Ngoài
    -0.06
    POSITIVE LOGITS
     bacteria
    0.11
     sentences
    0.08
     bacter
    0.08
    0.07
     TBranch
    0.07
     بالاتر
    0.07
     Cuba
    0.07
    _MT
    0.07
     bacterial
    0.06
    (cnt
    0.06
    Act Density 0.013%

    No Known Activations