INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Rising
    -0.08
     successo
    -0.07
     проб
    -0.07
     barg
    -0.07
     обознач
    -0.07
     pont
    -0.07
     baba
    -0.07
     Fighting
    -0.07
    versammlung
    -0.07
     назы
    -0.07
    POSITIVE LOGITS
    $class
    0.08
    zb
    0.08
    UL
    0.08
     centr
    0.08
     HT
    0.08
    <class
    0.07
     KE
    0.07
    UBL
    0.07
    Invent
    0.07
     Belf
    0.07
    Act Density 0.001%

    No Known Activations