INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     ویکی‌پدیای
    -0.84
     Мексичка
    -0.74
    uxxxx
    -0.73
     تضيفلها
    -0.71
     חיצוניים
    -0.70
    thâu
    -0.69
    EndGlobalSection
    -0.68
     cherchés
    -0.68
     NSCoder
    -0.66
     mères
    -0.66
    POSITIVE LOGITS
    0.91
    -
    0.57
     III
    0.52
     opening
    0.49
     II
    0.49
    *
    0.49
      
    0.48
     VI
    0.47
    XmlAttribute
    0.47
    \
    0.47
    Act Density 0.004%

    No Known Activations