INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     illusions
    -0.08
     од
    -0.07
     mito
    -0.07
    -0.07
    MT
    -0.07
     Sac
    -0.07
     belir
    -0.07
     Catal
    -0.07
    -0.07
    Healing
    -0.07
    POSITIVE LOGITS
     mitte
    0.08
    Men
    0.08
    rect
    0.08
    02
    0.08
     Vale
    0.08
     Jem
    0.08
    -moi
    0.07
    তম
    0.07
    898
    0.07
    Vale
    0.07
    Act Density 0.055%

    No Known Activations