INDEX
    Explanations

    является

    New Auto-Interp
    Negative Logits
    Doing
    -0.07
     endereco
    -0.07
     aussi
    -0.06
     écrit
    -0.06
    ópez
    -0.06
    _CBC
    -0.06
    SO
    -0.06
     dinero
    -0.06
     microscope
    -0.06
    -Free
    -0.06
    POSITIVE LOGITS
     является
    0.07
    kel
    0.07
     Abed
    0.07
     Б
    0.07
    0.07
     был
    0.07
     ไป
    0.06
    0.06
    0.06
     считается
    0.06
    Act Density 0.020%

    No Known Activations