INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    edes
    -0.08
     dégust
    -0.08
    arest
    -0.08
     degust
    -0.08
    Vos
    -0.08
     denomination
    -0.08
     streets
    -0.08
     oportunidad
    -0.08
     sav
    -0.08
     desperation
    -0.07
    POSITIVE LOGITS
    0.08
    Ik
    0.08
     NEED
    0.07
     spoken
    0.07
     Mit
    0.07
     جواب
    0.07
    ک
    0.07
    Speaker
    0.07
     tractor
    0.07
    _OR
    0.07
    Act Density 0.002%

    No Known Activations