INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     cauliflower
    -0.08
    hör
    -0.08
    -0.08
    这类
    -0.07
    (comment
    -0.07
     hype
    -0.07
     headlines
    -0.07
    	placeholder
    -0.07
    OFF
    -0.07
    .Selection
    -0.07
    POSITIVE LOGITS
     fb
    0.08
    neys
    0.07
     экон
    0.07
    0.07
    0.07
    otify
    0.06
    .song
    0.06
     Disney
    0.06
     jquery
    0.06
    צטר
    0.06
    Act Density 0.016%

    No Known Activations