INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     tóc
    -0.33
     Constitucional
    -0.33
     alguna
    -0.32
     caballo
    -0.32
     ilustración
    -0.32
     respiración
    -0.32
     gärna
    -0.32
     mãos
    -0.32
     fotográfico
    -0.32
     couteau
    -0.31
    POSITIVE LOGITS
    DOCTYPE
    1.03
    awtextra
    0.90
    الحياه
    0.86
     autorytatywna
    0.85
     nahilalakip
    0.84
     للاسماء
    0.83
     ویکی‌پدی
    0.82
    ThroughAttribute
    0.81
    LookAnd
    0.79
    complexContent
    0.77
    Act Density 0.005%

    No Known Activations