INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    oking
    -0.08
    otlin
    -0.08
     begynd
    -0.08
    589
    -0.08
    -M
    -0.08
    cx
    -0.07
     entrando
    -0.07
    ddb
    -0.07
    cas
    -0.07
     Showtime
    -0.07
    POSITIVE LOGITS
     تشير
    0.09
     Arist
    0.08
     הכ
    0.08
     vets
    0.08
     कर
    0.08
     significa
    0.08
     قدم
    0.07
     وراء
    0.07
     entails
    0.07
    0.07
    Act Density 0.039%

    No Known Activations