INDEX
    Explanations

    past tense "be"

    New Auto-Interp
    Negative Logits
     sober
    -0.06
    -sample
    -0.06
    イト
    -0.06
    _sq
    -0.06
     якої
    -0.06
     sân
    -0.06
    _'
    -0.06
     psychic
    -0.06
     samp
    -0.06
    φέρει
    -0.06
    POSITIVE LOGITS
    ipv
    0.07
    DEBUG
    0.07
    oser
    0.07
    之间
    0.06
    lius
    0.06
    _attempts
    0.06
     NavLink
    0.06
     účin
    0.06
    [cell
    0.06
    0.06
    Act Density 0.018%

    No Known Activations