INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     letra
    -0.07
    تن
    -0.07
    ammed
    -0.07
    ترجم
    -0.07
    issen
    -0.07
    ireccion
    -0.07
    .bind
    -0.07
    odie
    -0.07
    ATURE
    -0.07
    .Timeout
    -0.07
    POSITIVE LOGITS
     знает
    0.08
    Coal
    0.07
     Önceki
    0.07
    -St
    0.07
     Boss
    0.07
     הו
    0.07
     Lotus
    0.07
     Alarm
    0.07
     אחרונות
    0.07
     comic
    0.07
    Act Density 0.002%

    No Known Activations