INDEX
    Explanations
    No Explanations Found
    New Auto-Interp
    Negative Logits
     adamant
    -0.08
    /cmd
    -0.07
     אבל
    -0.07
     but
    -0.07
    Yesterday
    -0.07
    );">↵
    -0.07
     דואר
    -0.07
     Steelers
    -0.07
     remorse
    -0.06
    最主要的
    -0.06
    POSITIVE LOGITS
    mony
    0.08
     [/
    0.07
    load
    0.07
    Win
    0.07
     IP
    0.07
    axis
    0.06
    zed
    0.06
    .Show
    0.06
    0.06
    ucer
    0.06
    Act Density 0.105%

    No Known Activations