INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    _fin
    -0.08
    	match
    -0.07
    สร
    -0.07
    /text
    -0.07
    numerusform
    -0.07
    (Print
    -0.07
    𫓧
    -0.06
    صدر
    -0.06
    -avatar
    -0.06
    PIPE
    -0.06
    POSITIVE LOGITS
    ysics
    0.07
    焦虑
    0.07
    最低
    0.07
    建筑设计
    0.07
     różnic
    0.07
    ked
    0.06
     verdade
    0.06
     pesso
    0.06
    sorted
    0.06
     Clinic
    0.06
    Act Density 0.001%

    No Known Activations