INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     girl
    -0.08
     apunta
    -0.08
    оси
    -0.08
    -0.08
     apunt
    -0.07
    Torque
    -0.07
     tch
    -0.07
     мог
    -0.07
     traslado
    -0.07
     usuario
    -0.07
    POSITIVE LOGITS
     UW
    0.08
    ifiz
    0.08
     NUnit
    0.07
    sf
    0.07
    velop
    0.07
    436
    0.07
     geometric
    0.07
    fits
    0.07
     Vir
    0.07
    REAT
    0.07
    Act Density 0.001%

    No Known Activations