INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     Wen
    -0.08
    UIText
    -0.07
    Perf
    -0.07
    -0.07
    pear
    -0.07
     TEX
    -0.07
     Chang
    -0.07
     mempert
    -0.07
    -0.07
    циони
    -0.07
    POSITIVE LOGITS
     dread
    0.10
     impending
    0.09
     doom
    0.09
    ਾਵ
    0.08
    力量
    0.08
     ನಿವ
    0.08
     μεγάλη
    0.08
    igit
    0.08
    volle
    0.07
     feeling
    0.07
    Act Density 0.002%

    No Known Activations