INDEX
    Explanations

    japanese and korean verb endings

    New Auto-Interp
    Negative Logits
    だと思います
    0.81
    如果您
    0.77
    してみてください
    0.76
    잖아요
    0.75
    นะครับ
    0.75
    ですよ
    0.74
    ですよね
    0.73
    겠죠
    0.73
     거예요
    0.73
    ってます
    0.73
    POSITIVE LOGITS
     있으며
    0.84
    だが
    0.80
    しており
    0.76
    으며
    0.73
    이다
    0.67
    이며
    0.67
    했으며
    0.66
    하며
    0.64
     보인다
    0.64
    であり
    0.64
    Act Density 0.002%

    No Known Activations