INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    -0.07
     Ryu
    -0.07
     Crack
    -0.07
     swarm
    -0.07
    /widget
    -0.07
     Hz
    -0.06
    .Tools
    -0.06
    Increase
    -0.06
     Crush
    -0.06
     Swarm
    -0.06
    POSITIVE LOGITS
     Bon
    0.17
     bon
    0.13
    Bon
    0.13
    Fel
    0.09
     bons
    0.09
     Bonnie
    0.09
     Fel
    0.09
     bona
    0.08
     Bel
    0.08
    bon
    0.08
    Act Density 0.007%

    No Known Activations