INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    _coord
    -0.06
     indict
    -0.06
     fol
    -0.06
     офици
    -0.06
    -0.06
     Bellev
    -0.06
     öff
    -0.06
     травня
    -0.06
     surfaces
    -0.06
     partie
    -0.06
    POSITIVE LOGITS
    Str
    0.06
    <Func
    0.06
    porn
    0.06
    stup
    0.06
    PropertyName
    0.06
    PING
    0.06
                     
    0.06
    alcon
    0.06
    .Promise
    0.06
     znovu
    0.05
    Act Density 0.003%

    No Known Activations