INDEX
    Explanations

    mathematical difference

    New Auto-Interp
    Negative Logits
     forage
    -0.09
    CMC
    -0.08
     Outreach
    -0.08
     saver
    -0.08
    reachable
    -0.08
     teh
    -0.08
     Lleg
    -0.08
     uning
    -0.08
     (*.
    -0.08
     tərəfindən
    -0.07
    POSITIVE LOGITS
     Δ
    0.12
    Δ
    0.12
     Delta
    0.11
    .delta
    0.10
    0.10
    Delta
    0.10
     delta
    0.09
     differences
    0.09
    _delta
    0.09
    0.09
    Act Density 0.172%

    No Known Activations