INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     الفلسط
    -0.55
    GEBURTSDATUM
    -0.50
     Shakspeare
    -0.47
     الفلسطينية
    -0.47
    帖最后由
    -0.46
    oa̍t
    -0.45
     الاجتماعي
    -0.44
     الغذ
    -0.44
     الصحية
    -0.44
     برابوك
    -0.43
    POSITIVE LOGITS
    الإنجليزية
    0.69
     הע
    0.55
     המ
    0.54
     للمعارف
    0.52
     הח
    0.49
     הה
    0.47
    الع
    0.45
    הח
    0.45
     הנו
    0.45
    THE
    0.44
    Act Density 0.049%

    No Known Activations