INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    aket
    -0.08
    621
    -0.07
     Consort
    -0.07
    706
    -0.07
    -circle
    -0.07
     EN
    -0.07
     کاهش
    -0.07
     ku
    -0.07
     Cartesian
    -0.06
    377
    -0.06
    POSITIVE LOGITS
    debug
    0.08
     Bugs
    0.07
    ska
    0.07
    Debug
    0.07
     agendas
    0.07
    .Logf
    0.07
    .impl
    0.07
    ddd
    0.07
     debug
    0.06
     bug
    0.06
    Act Density 0.008%

    No Known Activations