INDEX
    Explanations

    measurements and quantities

    New Auto-Interp
    Negative Logits
    archivo
    -0.08
     עבודה
    -0.08
    anner
    -0.07
    xae
    -0.07
    _SO
    -0.07
        	   
    -0.07
    innen
    -0.07
     education
    -0.07
    ający
    -0.07
    (ret
    -0.07
    POSITIVE LOGITS
     boat
    0.07
    哥伦比亚
    0.07
    usat
    0.06
    带上
    0.06
    豆浆
    0.06
     cuando
    0.06
     Lola
    0.06
    れた
    0.06
    0.06
    𐭉
    0.06
    Act Density 0.159%

    No Known Activations