INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     notebook
    -0.07
    .Active
    -0.07
     neil
    -0.07
    cours
    -0.07
     effort
    -0.07
     MOT
    -0.07
    עוד
    -0.07
    quest
    -0.07
     Tribal
    -0.07
    ibur
    -0.07
    POSITIVE LOGITS
    0.08
     Bowling
    0.08
     Harding
    0.08
    িতে
    0.08
    าด
    0.07
     vac
    0.07
     taille
    0.07
     Rai
    0.07
     Bade
    0.07
     demeanor
    0.07
    Act Density 0.008%

    No Known Activations