INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    _receive
    -0.08
     reciben
    -0.08
     təmin
    -0.08
     Histor
    -0.08
    -0.08
     لگ
    -0.07
     concili
    -0.07
    -0.07
     recib
    -0.07
     recibió
    -0.07
    POSITIVE LOGITS
     sewage
    0.08
    binder
    0.08
     cups
    0.08
    speech
    0.07
    .player
    0.07
     Ashley
    0.07
    .repository
    0.07
     Phrase
    0.07
    pam
    0.07
     Aurora
    0.07
    Act Density 0.082%

    No Known Activations