INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     angekommen
    -0.08
     Mother's
    -0.08
    kua
    -0.08
    +i
    -0.08
    -0.08
    은행
    -0.08
     contín
    -0.08
    -ком
    -0.08
     umr
    -0.08
    -0.08
    POSITIVE LOGITS
    0.08
     triangles
    0.07
     पैदा
    0.07
     स्त
    0.07
    0.07
    0.07
    0.07
     בת
    0.07
    В
    0.07
     radically
    0.07
    Act Density 0.008%

    No Known Activations