INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    <source
    -0.07
    初步
    -0.07
    正在进行
    -0.07
     הבוקר
    -0.06
    一轮
    -0.06
    מסע
    -0.06
    -0.06
    _ANDROID
    -0.06
    放手
    -0.06
    -0.06
    POSITIVE LOGITS
    frey
    0.08
    pez
    0.08
    0.07
    资料显示
    0.07
    IALIZED
    0.07
    Deg
    0.06
    rog
    0.06
    _RANK
    0.06
     contact
    0.06
    0.06
    Act Density 0.005%

    No Known Activations