INDEX
    Explanations

    calculations

    New Auto-Interp
    Negative Logits
    _UNDER
    -0.08
     tuberculosis
    -0.08
    football
    -0.07
    記者
    -0.07
     kcal
    -0.07
    _top
    -0.07
    捕捉
    -0.07
    รวบรวม
    -0.07
    -0.07
    上赛季
    -0.07
    POSITIVE LOGITS
    0.07
    _WIN
    0.07
    0.06
                    ↵                ↵
    0.06
    🙈
    0.06
    mát
    0.06
    ايا
    0.06
    中国政府
    0.06
     رس
    0.06
    กา
    0.06
    Act Density 0.019%

    No Known Activations