INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    Boxes
    -0.07
    _embedding
    -0.07
    ,val
    -0.07
    -0.07
    fall
    -0.07
     loc
    -0.07
     arb
    -0.06
     limite
    -0.06
     OL
    -0.06
     Bis
    -0.06
    POSITIVE LOGITS
     pneumonia
    0.09
     pneum
    0.08
    neum
    0.07
     إذ
    0.07
    umatic
    0.07
    ですか
    0.07
    イヤ
    0.06
     tense
    0.06
     Electronic
    0.06
    ですね
    0.06
    Act Density 0.004%

    No Known Activations