INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Bard
    -0.07
     BMP
    -0.07
    Silver
    -0.07
    無しさん
    -0.07
    248
    -0.07
     Brah
    -0.07
    .Di
    -0.06
     Burg
    -0.06
     Lif
    -0.06
    'er
    -0.06
    POSITIVE LOGITS
    .NotNull
    0.07
    instr
    0.06
     #####
    0.06
     deut
    0.06
     push
    0.06
    .http
    0.06
    oolStrip
    0.06
    icion
    0.06
     kèm
    0.06
     upload
    0.06
    Act Density 0.001%

    No Known Activations