INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    -0.08
     Europeans
    -0.07
    .fake
    -0.07
    .Info
    -0.07
    Device
    -0.07
     Devices
    -0.07
    -0.07
    dirs
    -0.07
     Leh
    -0.07
    -0.06
    POSITIVE LOGITS
     záp
    0.06
     ομά
    0.06
    eff
    0.06
    .drawImage
    0.06
     excer
    0.06
    (Size
    0.06
    ‌است
    0.06
    .bootstrapcdn
    0.06
     greed
    0.06
     перший
    0.06
    Act Density 0.005%

    No Known Activations