INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    assy
    -0.08
    -0.08
    .Join
    -0.08
     rump
    -0.08
    -0.07
     okup
    -0.07
     Railroad
    -0.07
    .netty
    -0.07
    -0.07
     Ben
    -0.07
    POSITIVE LOGITS
     shap
    0.08
    vit
    0.08
     дозвол
    0.08
     pakk
    0.08
    允许
    0.07
     软件
    0.07
     mật
    0.07
     पत्र
    0.07
    _check
    0.07
     BMP
    0.07
    Act Density 0.000%

    No Known Activations