INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    ดำ
    -0.07
     affirmative
    -0.07
     말을
    -0.07
     současné
    -0.07
     vf
    -0.07
    ollower
    -0.06
    ffffff
    -0.06
    -trigger
    -0.06
    NOP
    -0.06
    άλι
    -0.06
    POSITIVE LOGITS
     lend
    0.15
     lends
    0.14
     lending
    0.11
     lent
    0.10
     offered
    0.07
     extremely
    0.07
    .emplace
    0.06
     stead
    0.06
     donation
    0.06
    ランス
    0.06
    Act Density 0.004%

    No Known Activations