INDEX
    Explanations

    verbs for action/creation

    New Auto-Interp
    Negative Logits
     लगते
    0.54
     발생하는
    0.53
    ப்படுகின்றன
    0.50
     मिळत
    0.50
    되는
    0.47
     येत
    0.47
     می‌کن
    0.46
     இருக்கிறது
    0.45
    Есть
    0.44
     Existe
    0.44
    POSITIVE LOGITS
     постави
    0.67
     подели
    0.63
     оформи
    0.63
     zrobi
    0.62
     направи
    0.62
     выступи
    0.62
     сделал
    0.62
     выпусти
    0.62
     связа
    0.59
     сыгра
    0.58
    Act Density 0.000%

    No Known Activations