INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    NODE
    -0.08
    Toy
    -0.08
    -0.08
    -0.08
     Toy
    -0.08
     Balloon
    -0.08
    nid
    -0.08
    -0.07
    -0.07
     eenvoud
    -0.07
    POSITIVE LOGITS
     gross
    0.08
     Selena
    0.08
     Oprah
    0.07
     sip
    0.07
     pulses
    0.07
     Hoffman
    0.07
     مسؤول
    0.07
     Supervis
    0.07
     постав
    0.07
     Vast
    0.07
    Act Density 0.011%

    No Known Activations