INDEX
    Explanations
    New Auto-Interp
    Negative Logits
    -0.08
    Currently
    -0.07
    Coun
    -0.07
    kennt
    -0.07
    ideen
    -0.07
    iever
    -0.07
    -0.07
    Look
    -0.07
    lices
    -0.07
    ientemente
    -0.07
    POSITIVE LOGITS
     сам
    0.10
     passive
    0.09
     וכל
    0.08
     unnamed
    0.08
     קר
    0.08
     Raim
    0.08
     स्वयं
    0.08
    _magic
    0.08
     Yosh
    0.07
    ถาม
    0.07
    Act Density 0.119%

    No Known Activations