INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     муж
    -0.06
    	camera
    -0.06
              
    -0.06
    名無しさん
    -0.06
     crt
    -0.06
    159
    -0.06
    (protocol
    -0.06
     dnes
    -0.06
    /people
    -0.06
     мира
    -0.06
    POSITIVE LOGITS
     mình
    0.07
     üy
    0.07
    egot
    0.07
    grab
    0.06
     Esther
    0.06
     вза
    0.06
    ckt
    0.06
    otion
    0.06
    imonials
    0.06
    ;');↵
    0.06
    Act Density 0.033%

    No Known Activations