INDEX
    Explanations

    and complete, didn, give, warm, tried

    New Auto-Interp
    Negative Logits
    <0xBF>
    0.29
              
    0.28
     Nonlinear
    0.25
    <0xBD>
    0.25
                     
    0.25
     thereof
    0.25
                              
    0.23
    ↓↓
    0.23
    0.23
    0.23
    POSITIVE LOGITS
     trochę
    0.37
     약간
    0.34
     trochu
    0.34
     also
    0.33
     algunas
    0.33
    Tenemos
    0.32
     imaju
    0.32
    也有
    0.31
     coś
    0.31
     there
    0.31
    Act Density 0.477%

    No Known Activations