INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Bee
    -0.07
    中铁
    -0.07
     quarter
    -0.07
    vertime
    -0.07
    تر
    -0.07
    集中
    -0.07
    -0.07
     hearing
    -0.07
    -0.07
    حسن
    -0.07
    POSITIVE LOGITS
    ując
    0.08
    产物
    0.07
     fixtures
    0.07
     namespaces
    0.07
     disposable
    0.07
    0.07
     znajdu
    0.07
     ä
    0.07
     symlink
    0.07
     avait
    0.06
    Act Density 0.278%

    No Known Activations