INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Nej
    -0.07
    _tl
    -0.06
     ambition
    -0.06
     مناسب
    -0.06
     serif
    -0.06
    [count
    -0.06
    -0.06
     اختیار
    -0.06
     ETA
    -0.06
    اعر
    -0.06
    POSITIVE LOGITS
     gruesome
    0.08
     bizarre
    0.08
     Gig
    0.07
     horrific
    0.07
     extrem
    0.07
    _gateway
    0.06
    ге
    0.06
     verificar
    0.06
     můžete
    0.06
    عام
    0.06
    Act Density 0.007%

    No Known Activations