INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Grandma
    -0.08
     Yellow
    -0.07
    taan
    -0.07
     jaunes
    -0.07
     jaune
    -0.07
    etention
    -0.07
     oy
    -0.07
     yellow
    -0.07
     Pent
    -0.07
    ्यक्ष
    -0.07
    POSITIVE LOGITS
    -und
    0.09
    σκευ
    0.08
    reflect
    0.08
    thought
    0.08
    -er
    0.08
     desac
    0.08
    Und
    0.08
    0.08
     unser
    0.08
    Quartz
    0.07
    Act Density 0.027%

    No Known Activations