INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     lance
    -0.08
     dicks
    -0.07
    suffix
    -0.07
    rough
    -0.07
     autofocus
    -0.07
    strukce
    -0.07
    _PREVIEW
    -0.06
     dzi
    -0.06
    福利
    -0.06
    	Type
    -0.06
    POSITIVE LOGITS
    DB
    0.09
     db
    0.08
    db
    0.08
     DB
    0.07
     Lab
    0.07
    BY
    0.07
    	db
    0.07
     Db
    0.07
    ,DB
    0.07
     στη
    0.07
    Act Density 0.014%

    No Known Activations