INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    onie
    -0.07
     boosts
    -0.07
     grâce
    -0.07
     pronto
    -0.07
    ich
    -0.07
    JSON
    -0.07
     ranking
    -0.07
     dzięki
    -0.07
    Quotes
    -0.07
    Arabic
    -0.07
    POSITIVE LOGITS
     是否
    0.13
    是否
    0.12
     apakah
    0.12
     여부
    0.12
     האם
    0.11
     feasibility
    0.11
    0.11
    有没有
    0.10
     affirmative
    0.10
     نعم
    0.10
    Act Density 0.052%

    No Known Activations