INDEX
    Explanations

    verbs about actions

    New Auto-Interp
    Negative Logits
     किन्तु
    0.48
    입니다
    0.46
    近年
    0.44
     પરંતુ
    0.43
    이며
    0.43
    可谓
    0.43
     परंतु
    0.43
     زمانہ
    0.43
     sifatida
    0.43
     平成
    0.43
    POSITIVE LOGITS
    なくても
    0.61
    近づ
    0.59
    入れる
    0.59
    つける
    0.58
    持って
    0.57
    0.56
    できるように
    0.56
     나올
    0.56
    0.55
     사용할
    0.55
    Act Density 0.018%

    No Known Activations