INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     violate
    -0.06
    Decl
    -0.06
     Reed
    -0.06
    .nz
    -0.06
     CCD
    -0.06
    bounded
    -0.06
    面的
    -0.06
     bru
    -0.06
    ray
    -0.06
     huh
    -0.06
    POSITIVE LOGITS
     automatically
    0.08
     ALLOW
    0.07
     automatic
    0.07
    цієн
    0.07
    Activate
    0.07
     Sammy
    0.07
     turist
    0.06
    /Form
    0.06
    indsight
    0.06
     tieten
    0.06
    Act Density 0.004%

    No Known Activations