INDEX
    Explanations

    asking questions

    New Auto-Interp
    Negative Logits
    imentu
    -0.10
    iellement
    -0.09
    ietet
    -0.08
    irut
    -0.08
    entious
    -0.08
    ément
    -0.07
    unct
    -0.07
    unprocessable
    -0.07
     opent
    -0.07
    יטת
    -0.07
    POSITIVE LOGITS
     frågor
    0.09
    .Is
    0.09
    :is
    0.08
     говоря
    0.08
     себя
    0.08
    0.08
    	Is
    0.08
    :Is
    0.07
     Vil
    0.07
     vecinos
    0.07
    Act Density 0.009%

    No Known Activations