INDEX
    Explanations

    continuation

    New Auto-Interp
    Negative Logits
    544
    -0.08
     horn
    -0.08
     humming
    -0.07
    Horn
    -0.07
     semi
    -0.07
     exert
    -0.07
     pin
    -0.07
     collo
    -0.07
    Held
    -0.07
    -0.07
    POSITIVE LOGITS
     arrests
    0.09
    /out
    0.09
    [out
    0.08
     aspiring
    0.08
     شامل
    0.08
    .before
    0.08
     troisième
    0.08
    0.08
     réal
    0.08
     יא
    0.08
    Act Density 0.003%

    No Known Activations