INDEX
    Explanations

    crucial, vital, important concepts

    New Auto-Interp
    Negative Logits
    ازت
    0.20
     ład
    0.19
     થો
    0.19
    𝚋
    0.18
     excuses
    0.18
     unhealthy
    0.18
     galima
    0.18
    一个新的
    0.18
     skor
    0.18
     rohkem
    0.18
    POSITIVE LOGITS
     crucial
    0.33
     fascinating
    0.28
     vital
    0.27
    重要な
    0.27
     vitally
    0.26
     важней
    0.26
     wichtigen
    0.26
    重要的
    0.24
     중요한
    0.24
     wichtige
    0.24
    Act Density 0.046%

    No Known Activations