INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     fic
    -0.09
    、と
    -0.08
     robots
    -0.08
    राम
    -0.08
    .Params
    -0.08
     poco
    -0.08
     জানা
    -0.07
     indeed
    -0.07
    avení
    -0.07
     pim
    -0.07
    POSITIVE LOGITS
    .capture
    0.11
     Capture
    0.10
    capture
    0.09
     capturing
    0.09
    _capture
    0.09
    Capture
    0.09
     capture
    0.09
    0.09
    0.09
    captures
    0.08
    Act Density 0.003%

    No Known Activations