INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    _proc
    -0.07
    ییر
    -0.07
    -0.07
    abin
    -0.06
     coloured
    -0.06
     سطح
    -0.06
    -0.06
     KW
    -0.06
    -0.06
    가를
    -0.06
    POSITIVE LOGITS
    .assertNot
    0.07
     ong
    0.07
     certains
    0.07
     düşünc
    0.07
     приб
    0.07
    ;color
    0.06
    OnInit
    0.06
    [unit
    0.06
    inear
    0.06
     февра
    0.06
    Act Density 0.006%

    No Known Activations