INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    (ctrl
    -0.07
     Pour
    -0.06
    спіль
    -0.06
     تولید
    -0.06
    }'
    -0.06
     Feed
    -0.06
    (bucket
    -0.06
    Mode
    -0.06
    _states
    -0.06
    	cli
    -0.06
    POSITIVE LOGITS
    TextEdit
    0.07
    0.07
    WE
    0.06
     UIF
    0.06
    نة
    0.06
    άβ
    0.06
     нескольких
    0.06
    aisal
    0.06
     occ
    0.06
    0.06
    Act Density 0.009%

    No Known Activations