INDEX
    Explanations

    medical texts

    New Auto-Interp
    Negative Logits
    -0.09
    borg
    -0.07
     brethren
    -0.07
    -box
    -0.07
     exited
    -0.07
     profess
    -0.07
    -0.07
     isa
    -0.07
    者の
    -0.07
     منه
    -0.07
    POSITIVE LOGITS
     rew
    0.07
     curly
    0.07
    0.07
    *w
    0.07
    0.06
    这些
    0.06
    ɰ
    0.06
    /W
    0.06
     QU
    0.06
    	df
    0.06
    Act Density 0.099%

    No Known Activations