INDEX
    Explanations

    punctuation

    New Auto-Interp
    Negative Logits
     Lip
    -0.08
    Approximately
    -0.08
    Lip
    -0.08
    Ear
    -0.07
    خلص
    -0.07
    adaxweyne
    -0.07
     सल
    -0.07
     शुभ
    -0.07
     тағы
    -0.07
    866
    -0.07
    POSITIVE LOGITS
    不会
    0.11
    ,没有
    0.11
    不是
    0.10
     whereas
    0.10
    真正
    0.09
    没有
    0.09
    ません
    0.09
     وليس
    0.09
     بينما
    0.09
    ,而
    0.09
    Act Density 0.068%

    No Known Activations