INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     shug
    -0.09
     meng
    -0.08
     Portuguesa
    -0.08
     vět
    -0.07
     уй
    -0.07
     Ž
    -0.07
     Samb
    -0.07
    _disconnect
    -0.07
     luminos
    -0.07
     mai
    -0.07
    POSITIVE LOGITS
    gefühl
    0.09
     instincts
    0.08
    gevoel
    0.08
    xiom
    0.08
    chat
    0.08
    /usr
    0.08
     छु
    0.08
    cla
    0.08
     महसूस
    0.08
    ilda
    0.07
    Act Density 0.007%

    No Known Activations