INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    这些年
    -0.07
    -0.07
     carte
    -0.07
     spacious
    -0.07
     Seite
    -0.07
     Sergey
    -0.07
    这么多年
    -0.07
    いち
    -0.07
     סו
    -0.06
    .Article
    -0.06
    POSITIVE LOGITS
     	
    0.07
    0.07
    火星
    0.07
    0.07
    0.07
    推理
    0.07
    <Transform
    0.07
    expired
    0.07
    _facebook
    0.07
    面容
    0.07
    Act Density 0.020%

    No Known Activations