INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     algebra
    -0.08
    hoof
    -0.07
     variation
    -0.07
     Afrika
    -0.07
    νού
    -0.07
    -0.07
    hiya
    -0.07
    anzeigen
    -0.07
     wash
    -0.07
    _alg
    -0.07
    POSITIVE LOGITS
     sert
    0.09
    0.09
    .gov
    0.08
     কর্মকর্ত
    0.07
     overhaul
    0.07
    Mint
    0.07
     कानून
    0.07
    Selections
    0.07
    批准
    0.07
     Drone
    0.07
    Act Density 0.004%

    No Known Activations