INDEX
    Explanations

    making proposals and actions

    New Auto-Interp
    Negative Logits
    되는
    0.68
    ப்படுகின்றன
    0.66
     робити
    0.61
     하는
    0.59
     लगते
    0.59
    하는
    0.58
     येत
    0.58
     decía
    0.56
    하던
    0.56
    водить
    0.56
    POSITIVE LOGITS
     постави
    0.83
     подели
    0.81
     выступи
    0.80
     попыта
    0.79
     предложи
    0.77
     потребо
    0.76
     почув
    0.76
     установи
    0.75
     приступи
    0.75
     посмотре
    0.75
    Act Density 0.015%

    No Known Activations