INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    лу
    -0.07
    Im
    -0.07
    Placement
    -0.07
     strike
    -0.06
    רעיונות
    -0.06
    يان
    -0.06
    ansen
    -0.06
    总监
    -0.06
    ограм
    -0.06
    漫长的
    -0.06
    POSITIVE LOGITS
    _USART
    0.08
     GTK
    0.07
    0.07
     manners
    0.07
    ,SIGNAL
    0.07
     наи
    0.07
    _ROUTE
    0.06
    QT
    0.06
    0.06
     מכל
    0.06
    Act Density 0.000%

    No Known Activations