INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     wave
    -0.08
     PI
    -0.07
     unt
    -0.07
    в
    -0.07
     Qin
    -0.07
    -0.07
     elect
    -0.07
     хро
    -0.07
     lost
    -0.07
     hap
    -0.07
    POSITIVE LOGITS
     דע
    0.09
    ’objectif
    0.09
     త్వర
    0.09
    ’el
    0.08
    omt
    0.08
     consp
    0.08
     선정
    0.08
    했다고
    0.08
    Desp
    0.08
     شناخت
    0.08
    Act Density 0.007%

    No Known Activations