INDEX
    Explanations

    defined and ambiguities

    New Auto-Interp
    Negative Logits
     الرجل
    0.48
     Nickelodeon
    0.42
     आदमी
    0.41
    ্ক
    0.40
     hombre
    0.40
    0.40
    男人
    0.38
     dług
    0.38
     man
    0.38
     ع
    0.38
    POSITIVE LOGITS
     ambiguities
    0.65
     ambiguous
    0.59
     ambiguity
    0.56
    0.41
    amb
    0.41
     ambigu
    0.40
     unambiguous
    0.39
     Amb
    0.38
     सर्वोत्तम
    0.38
    ambul
    0.38
    Act Density 0.000%

    No Known Activations