INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    ->_
    -0.07
     regs
    -0.06
     kiệm
    -0.06
     ست
    -0.06
     cổ
    -0.06
    _.
    -0.06
    **
    -0.05
     ain
    -0.05
    死亡
    -0.05
    -0.05
    POSITIVE LOGITS
    Touch
    0.17
     Touch
    0.14
     touches
    0.14
    touch
    0.13
    touches
    0.11
    _touch
    0.10
     TOUCH
    0.09
    -touch
    0.09
     touch
    0.09
    .touch
    0.08
    Act Density 0.004%

    No Known Activations