INDEX
    Explanations

    pronoun performing action

    New Auto-Interp
    Negative Logits
     ہونا
    0.35
     അല്ലെങ്കിൽ
    0.31
     결과
    0.30
    可能有
    0.30
     इससे
    0.30
     vermeiden
    0.29
     وجود
    0.29
    对抗
    0.29
     परिस्थित
    0.29
     সংসারে
    0.29
    POSITIVE LOGITS
     hurriedly
    0.42
     opened
    0.40
     knelt
    0.38
     hastily
    0.37
     duduk
    0.36
     gently
    0.36
     went
    0.35
    เข้าไป
    0.35
    早速
    0.35
     excitedly
    0.34
    Act Density 0.153%

    No Known Activations