INDEX
    Explanations

    references to flags or flagella

    New Auto-Interp
    Negative Logits
    \"");
    -0.82
     nahilalakip
    -0.73
     незавершена
    -0.72
    })()
    -0.67
    >--}}
    -0.64
     Вікіпе
    -0.61
    )");
    
    -0.60
    الإنجليزية
    -0.59
     ivelany
    -0.59
    دور
    -0.59
    POSITIVE LOGITS
     flags
    1.61
     Flags
    1.50
     FLAG
    1.37
     flag
    1.37
     Flag
    1.37
    flags
    1.36
     FLAGS
    1.31
    Flags
    1.29
    flag
    1.25
    FLAGS
    1.19
    Act Density 0.084%

    No Known Activations