INDEX
    Explanations

    imperative and prohibitive commands

    New Auto-Interp
    Negative Logits
     representa
    0.30
     इसने
    0.29
     وبالتالي
    0.28
    represents
    0.28
     somit
    0.28
     posee
    0.27
     hence
    0.27
     buvo
    0.27
     molten
    0.27
    0.27
    POSITIVE LOGITS
     jangan
    0.54
     Jangan
    0.52
     อย่า
    0.51
     hãy
    0.49
     đừng
    0.46
    Jangan
    0.46
     चुनें
    0.46
    你应该
    0.46
     باید
    0.45
    อย่า
    0.45
    Act Density 3.232%

    No Known Activations