INDEX
    Explanations
    New Auto-Interp
    Negative Logits
     ਹਾਂ
    -0.08
     viva
    -0.08
     totes
    -0.07
     regime
    -0.07
     heerlijke
    -0.07
    urf
    -0.07
     Trop
    -0.07
     probablement
    -0.07
     coalition
    -0.07
    、と
    -0.07
    POSITIVE LOGITS
    当前位置
    0.08
     Stewart
    0.08
     resetting
    0.07
    ડા
    0.07
     dicha
    0.07
     среды
    0.07
     seguida
    0.07
     splitting
    0.07
     hens
    0.07
     posición
    0.07
    Act Density 0.084%

    No Known Activations