INDEX
    Explanations

    Brain and limbic system

    New Auto-Interp
    Negative Logits
    -readable
    -0.07
     [](
    -0.07
    north
    -0.06
    方方面面
    -0.06
    -DD
    -0.06
    どう
    -0.06
    棋牌
    -0.06
    mode
    -0.06
    𨱑
    -0.06
    obs
    -0.06
    POSITIVE LOGITS
    Recognizer
    0.07
     instinct
    0.07
     firewall
    0.07
     VIR
    0.07
    Instruction
    0.07
    Sale
    0.07
     Transaction
    0.07
    分支机构
    0.07
    (IT
    0.07
    Bars
    0.07
    Act Density 0.014%

    No Known Activations