INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     construed
    -0.08
     monetary
    -0.08
     barbecue
    -0.07
     buy
    -0.07
     unread
    -0.07
    acea
    -0.07
     bourgeois
    -0.07
     intend
    -0.07
     בכך
    -0.07
     continuo
    -0.07
    POSITIVE LOGITS
     varias
    0.09
     timbang
    0.09
    واف
    0.08
     Prins
    0.08
    0.08
     السفر
    0.08
     pendek
    0.08
     لمدة
    0.08
    0.08
     Bis
    0.08
    Act Density 0.002%

    No Known Activations