INDEX
    Explanations

    conjunctions, particularly the word "and."

    New Auto-Interp
    Negative Logits
    олові
    -0.54
    ônica
    -0.53
     k
    -0.51
    geno
    -0.50
    czema
    -0.50
     Söhne
    -0.50
    blé
    -0.49
    dern
    -0.48
    تری
    -0.48
     C
    -0.47
    POSITIVE LOGITS
     оригіналу
    0.86
    󠁢
    0.72
     فريبيس
    0.69
     <<<<<<<<<<<<<<
    0.69
     समीक्षक
    0.68
    tagHelperRunner
    0.68
    ConstraintMaker
    0.67
    \{\\
    0.67
     المعيارى
    0.67
    الإنجليزية
    0.66
    Act Density 0.049%

    No Known Activations