INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    θή
    -0.07
    _,
    -0.07
    774
    -0.07
    _DOC
    -0.07
     Magnet
    -0.07
     magnet
    -0.07
     Confirm
    -0.07
     pard
    -0.07
    _modal
    -0.07
     способность
    -0.07
    POSITIVE LOGITS
     mond
    0.08
     vede
    0.07
     فيه
    0.07
     concreta
    0.07
    0.07
     pont
    0.07
    	void
    0.07
     novel
    0.07
     ponte
    0.07
     vog
    0.07
    Act Density 0.022%

    No Known Activations