INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    روط
    -0.08
     irregular
    -0.07
     uneven
    -0.07
     shift
    -0.07
    lemma
    -0.07
     Innoc
    -0.07
     Drum
    -0.07
     Valencia
    -0.07
     numéro
    -0.07
    -0.07
    POSITIVE LOGITS
     past
    0.18
     Past
    0.13
    Past
    0.12
    past
    0.11
    _past
    0.09
    过去
    0.09
    AST
    0.08
    .AF
    0.08
     West
    0.08
     last
    0.08
    Act Density 0.013%

    No Known Activations