INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     علم
    -0.07
    -0.07
     appendString
    -0.07
    -0.07
    زع
    -0.07
    散步
    -0.07
    .warning
    -0.06
    ,"\
    -0.06
    わかる
    -0.06
    📕
    -0.06
    POSITIVE LOGITS
    _LINUX
    0.07
    そうな
    0.07
    FOX
    0.07
    _LIGHT
    0.07
    _SLEEP
    0.07
    ifice
    0.06
    .helpers
    0.06
    0.06
     poetic
    0.06
     Metals
    0.06
    Act Density 0.000%

    No Known Activations