INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     TD
    -0.08
    -0.07
     konstant
    -0.07
     Lernen
    -0.07
     Soleil
    -0.07
     bun
    -0.07
     Berd
    -0.07
     Pu
    -0.06
    bera
    -0.06
     tek
    -0.06
    POSITIVE LOGITS
     subsection
    0.12
     الجزء
    0.10
    submenu
    0.10
     submenu
    0.10
     разделе
    0.09
    章节
    0.08
     jedhu
    0.08
     جزء
    0.08
     подраздел
    0.08
     liian
    0.08
    Act Density 0.008%

    No Known Activations